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让 得 机 组 成 及 汇编 语言 原 开 


本 书 以 创新 的 视角 介绍 了 计算 机 组 成 原理 ， 主 要 以 Java 虚 拟 机 为 例 ， 因 为 Java 虚 拟 机 是 一 个 极为 便 
利 、 时 新 、 可 移植 以 及 几乎 到 处 可 得 到 的 平台 。 

本 书 主张 读者 在 Java 虚 拟 机 的 范围 内 彻底 理解 计算 机 组 成 的 核心 原理 ， 然 后 将 这 些 原 理 拓展 到 其 他 四 
个 最 主要 的 平台 : Intel 8088、Pentium 4、Power 体 系 结构 及 Atmel AVR 微 控制 器 。 使 读者 能 快速 掌握 实际 
环境 中 计算 机 体系 结构 原理 ， 提 高 实践 和 应 用 能 





本 书 主要 内 容 
@ 计算 、 表示 以 及 虚拟 机 的 角色 。 
@ 算术 表达 式 : 符号 表示 、 存 储 程序 计算 机 及 运算 。 
@ 采用 领先 的 开源 Java 汇 编 器 jasmin 进 行 汇编 语言 编程 。 
@ 从 if 语 句 和 循环 到 子 例 程 的 控制 结构 。 
@ 真实 的 计算 机 体系 结构 : 优化 CPU、 存 储 器 及 外 设 。 
@@ 8088、Pentium 及 Power: 比较 其 组 成 、 体 系 结构 及 汇编 语言 。 
@@ Pentium 和 Power 体 系 结构 的 性 能 问题 ， 包 括 流水 线 。 
@ 人 微 控制 器 : 组 成 、 体 系 结构 、 接 口 及 程序 设计 。 
@ 高 级 Java 虚 拟 机 编程 : 复杂 和 派生 类 型 、 类、 继承 、 类 操作 、1MO 等 。 
@ 附录 涵盖 了 数字 逻辑 、Java 虚 拟 机 指令 集 、 操 作 代码 及 类 文件 格式 。 





作 科罗拉多 大 学 计算 机 科学 博士 ， 现 为 迪 尤 肯 大 学 数学 与 计算 机 科学 系 副 
者 Patrick Juola 教授 。 他 的 研究 兴趣 包括 自然 语言 处 理 、 语 言 心理 学 及 计算 机 安全 ,他 
- 曾 在 牛津 大 学 做 博士 后 ， 在 卡 内 基 一 梅 隆 大 学 的 CERT/CC 做 访问 科学 家 ， 在 PGP 公 司 做 专职 科学 家 ， 





入 
DC 
“。 

本 全 WA leelal se Nelelnn] 
a 


上 架 指导 ; 计算 机 计算 机 组 成 
客服 热线 : (010) 88378991, 88361066 ISBN 978-7-111-27785-9 
购书 热线 : (010) 68326294, 88379649, 68995259 
投稿 热线 : (010) 88379604 
读者 信箱 : hzjsj@hzbook.com 


华章 网 站 http://www.hzbook.com 


YY 网 上 网 书 : www.china-pub.com 





9 787111 277859 


Ey 定价 : 39.00 元 














FP 





本 书 以 Java 虚 拟 机 为 基础 介绍 计算 机 组 织 和 系统 结构 。 前 半 部 分 洱 盖 了 计算 机 组 织 的 一 
般 原理 ,以 及 汇编 语言 编程 的 艺术 ,后 半 部 分 关注 于 各 种 不 同 CPU 在 系统 结构 上 的 特殊 细节 ， 
包括 奔腾 、8088、Power 系 统 结构 以 及 作为 典型 戏 和 人 式 系统 控制 世 片 例子 的 Atmel AVR。 

本 书 全 面 反 映 了 IEEE 和 ACM 所 推荐 的 标准 计算 机 体系 结构 及 组 成 课程 应 涵盖 的 知识 要 
点 ， 适 用 范围 广 ， 可 作为 高 等 院 校 计算 机 及 相关 专业 计算 机 组 成 课程 的 教材 。 
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文艺 复兴 以 降 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规范 ， 使 西方 国家 在 自然 科学 的 
各 个 领域 取得 了 垄断 性 的 优势 ， 也 正 是 这 样 的 传统 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 
家 辈出 、 独 领 风骚 。 在 商业 化 的 进程 中 ， 美 国 的 产业 界 与 教育 界 越 来 越 紧密 地 结合 ， 计 算 机 
学 科 中 的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科 学 著作 ， 不 仅 壁 
划 了 研究 的 范畴 ， 还 揭示 了 学 术 的 源 变 ， 既 遵循 学 术 规 范 ， 又 自 有 学 者 个 性 ， 其 价值 并 不 会 
因 年 月 的 流逝 而 减退 。 

近年 ， 在 全 球 信息 化 大 潮 的 推动 下 ,我国 的 计算 机 产业 发 展 迅猛 ， 对 专业 人 才 的 需求 日 
益 迫 切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ， 而 专业 教材 的 建设 在 教育 战略 
上 显得 举足轻重 。 在 我 国信 息 技术 发 展 时 间 较 短 的 现状 下 ， 美 国 等 发 达 国 家 在 其 计算 机 科学 
发 展 的 几 十 年 间 积 淀 和 发 展 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国外 优秀 计 
算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 到 积极 的 推动 作用 ， 也 是 与 世界 接轨 、 建 设 真 正 
的 世界 一 流 大 学 的 必由之路 。 

机 械 工业 出 版 社 华章 分 社 较 早 意识 到 “出 版 要 为 教育 服务 ”"。 自 1998 年 开始 ， 华 章 分 社 就 
将 工作 重点 放 在 了 六 选 、 移 译 国外 优秀 教材 上 。 经 过 多 年 的 不 懈 努 力 ， 我 们 与 Pearson， 
McGraw-Hill，Elsevier，MIT，John Wiley & Sons，Cengage 等 世界 著名 出 版 公司 建立 了 良好 
的 合作 关系 ， 从 他 们 现 有 的 数 百 种 教材 中 甄选 出 Andrew S. Tanenbaum，Bjarne Stroustrup， 
Brain W. Kernighan, Dennis Ritchie, Jim Gray, Afred V. Aho, John E. Hopcroft, Jeffrey D. 
Ullman, Abraham Silberschatz, William Stallings, Donald E. Knuth, John L. Hennessy, Larry 
L. Peterson 等 大 师 名 家 的 一 批 经 典 作 品 ， 以 “计算 机 科学 丛书 ”为 总 称 出 版 ， 供 读者 学 习 、 研 
究 及 珍藏 。 大 理 石 纹理 的 封面 ， 也 正体 现 了 这 套 丛书 的 品位 和 格调 。 

“计算 机 科学 丛书 ”的 出 版 工作 得 到 了 国内 外 学 者 的 此 力 衷 助 ， 国 内 的 专家 不 仅 提 供 了 中 
肯 的 选 题 指导 ， 还 不 辞 劳苦 地 担任 了 翻译 和 审 校 的 工作 ， 而 原 书 的 作者 也 相当 关注 其 作品 在 
中 国 的 传播 ， 有 的 还 专程 为 其 书 的 中 译本 作 序 。 迄 今 ,“ 计 算 机 科学 丛书 ”已 经 出 版 了 近 两 百 
个 品种 ， 这 些 书 籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采 用 为 正式 教材 和 参考 书籍 。 
其 影印 版 “经 典 原版 书库 ”作为 姊妹 篇 也 被 越 来 越 多 实施 双语 教学 的 学 校 所 采用 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因素 使 我 们 的 
图 书 有 了 质量 的 保证 。 随 着 计算 机 科学 与 技术 专业 学 科 建 设 的 不 断 完 善 和 教材 改革 的 逐渐 深 
化 ， 教 育 界 对 国外 计算 机 教材 的 需求 和 应 用 都 将 步 人 一 个 新 的 阶段 ， 我 们 的 目标 是 尽善尽美 ， 
而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 的 重要 帮助 。 华 章 分 社 欢迎 老师 和 读者 对 我 们 的 工 
作 提 出 建议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 : 


华章 网 站 ; www.hzbook.com 

电子 邮件 : hzjsj@hzbook.com 

联系 电话 : (010) 88379604 

联系 地 址 ， 北 京 市 西城 区 百 万 庄 南 街 1 号 
邮政 编码 ，100037 








当前 ， 对 于 计算 机 组 成 与 系统 结构 类 的 本 科 课程 ， 在 教学 上 的 主要 困难 之 一 是 难以 选择 
一 个 合适 的 教学 用 体系 结构 。 能 清楚 体现 计算 机 组 成 和 体系 结构 原理 的 芯片 早已 过 时 ， 而 对 
于 先进 的 奔腾 机 ， 这 些 基本 原理 则 淹没 于 复杂 的 实现 方法 和 策略 中 。 

本 书 作者 意识 到 了 目前 计算 机 组 织 和 系统 结构 在 教学 选材 上 的 困难 ， 并 采取 JVM 作 为 教 
学 体系 结构 。 这 是 从 新 的 角度 进行 的 有 益 尝 试 。JVM 非 常 简单 、 易 于 理解 ， 因 而 可 能 会 成 为 
系统 结构 教学 的 最 佳 用 机 之 一 。 但 JVM 毕 竟 与 真实 计算 机 存在 物理 差别 ， 为 表明 这 种 差别 ， 
作者 也 有 针对 性 地 介绍 了 其 他 儿 种 典型 的 体系 结构 。 

本 书 的 特点 是 内 容 广泛 且 有 一 定 深 度 ， 从 最 基本 的 电子 器 件 、 二 进 制 表示 和 计算 ， 到 
jasmin 汇 编 语言 程序 设计 ， 再 到 现实 世界 中 存在 的 计算 机 系统 结构 ， 最 后 到 JVM 高 级 编程 课 
题 ， 几 乎 涵盖 了 所 有 相关 的 主题 。 并 且 ， 在 每 个 章节 都 提供 了 习题 ， 以 巩固 知识 。 

本 书 适 合 于 作为 大 学 二 、 三 年 级 相关 课程 的 教材 或 教学 参考 书 。 学 生 们 通过 一 学 期 的 学 
习 ， 就 能 基本 掌握 计算 机 组 成 的 基本 原理 及 汇编 语言 编程 。 当 然 ， 如 果 学 生 们 已 经 掌握 了 计 
算 机 的 最 基础 知识 ， 再 学 习 本 书 则 效果 更 好 。 

本 书 由 三 位 老师 合作 翻译 。 吴 为 民 翻 译 了 第 1、2、3、4、10 章 以 及 附录 A、C、D、E， 
艾 丽 华 翻 译 了 第 5S、6、7、8、9 章 ， 张 大 伟 翻 译 了 附录 B。 由 于 本 书 的 翻译 工作 是 在 繁忙 的 教 
学 、 科 研 工 作 之 余 完 成 的 ， 难 免 有 距 漏 之 处 ， 欢 迎 各 位 读者 给 予 批评 指正 。 


译 者 
2009 年 10 月 
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本 书 内 容 


这 是 一 本 关于 Java 虚 拟 机 (Java Virtual Machine，JVM) 组 织 和 系统 结构 的 书 。JVM 是 处 
于 Java 语 言 核心 的 软件 ， 并 出 现在 大 多 数 计算 机 、Web 浏 览 器 、PDA 以 及 网 络 化 附属 设备 中 。 
本 书 还 涵盖 了 计算 机 组 织 和 系统 结构 的 一 般 原 理 ， 并 以 其 他 流行 (或 不 那么 流行 ) 的 计算 机 
为 例 加 以 说 明 。 

这 不 是 一 本 关于 编程 语言 Java 的 书 ， 虽 然 具备 Java 语 言 或 类 Java 语 言 (C、C++、Pascal、 
Algol 等 ) 的 一 些 知识 会 有 所 帮助 。 本 书 是 一 本 关于 Java 语 言 如 何 使 事件 发 生 以 及 计算 如 何 产 
生 的 书 。 

这 本 书 的 写作 开始 于 一 个 现代 技术 的 实验 。 当 我 开始 任教 于 目前 的 大 学 时 (1998 年 )， 计 
算 机 组 织 和 系统 结构 课程 用 的 主要 是 运行 MS-DOS 的 8088， 这 个 编程 环境 实质 上 与 修 这 门 课 的 
二 年 级 学 生年 龄 相当 。( 遗 憾 的 是 ， 这 种 时 间 上 的 迟滞 相当 普遍 。 当 我 在 本 科 修 同样 的 课程 时 ， 
所 学 系统 结构 的 相应 计算 机 只 比 我 “年 轻 ”2 年 。) 根本 问题 是 现代 奔腾 4 芯片 不 是 特别 好 的 教 
学 用 系统 结构 。 它 加 入 了 有 20 年 历史 的 8088 的 所 有 功能 ， 包 括 其 局 限 ， 并 提供 了 复杂 的 变通 
方法 。 由 于 这 个 复杂 性 问题 ， 就 难以 在 不 详细 引用 早已 过 时 的 芯片 集 的 情况 下 解释 清楚 奔腾 4 
的 工作 原理 。 教 科 书 主要 讲解 的 是 较 简 单 的 8088 ， 然 后 作为 扩展 和 后 续 思 考 来 描述 实际 要 使 
用 的 计算 机 。 这 就 好 比 在 福特 A 型 上 学 习 汽 车 力学 ， 后 来 只 讨论 如 催化 式 排 气 净 化 器 、 自 动 轰 
驶 、 基 于 钥匙 的 点 火 系统 等 重要 概念 。 计 算 机 系统 结构 课程 不 应 被 迫 成 为 计算 历史 的 课程 。 

与 此 不 同 的 是 ， 我 想 采 用 一 种 易于 理解 的 系统 结构 来 教 这 门 课 ， 该 系统 结构 结合 了 现代 
原理 且 本 身 对 学 生 有 用 。 由 于 每 个 运行 Web 浏 览 器 的 计算 机 都 结合 了 JVM 的 一 个 副本 作为 软 
件 ， 因 此 几乎 每 个 当今 的 计算 机 都 已 经 有 了 兼容 的 JVM 供 其 使 用 。 

因而 这 本 书 涵盖 了 计算 机 组 织 和 系统 结构 的 核心 方面 ， 数字 逻辑 和 系统 、 数 据 表 示 以 及 
计算 机 组 织 /系统 结构 。 本 书 还 描述 了 一 种 特定 系统 结构 JVM 的 汇编 级 语言 ， 并 且 介 绍 了 其 他 
常见 的 系统 结构 (如 英特尔 奔腾 4 和 Power PC) 作为 支持 例子 但 不 作为 重点 。 正 如 IEEE 计 算 
机 学 会 和 美国 计算 机 协会 所 推荐 的 ， 本 书 尤 其 适合 作为 计算 机 系统 结构 和 组 织 的 标准 二 年 级 
课程 。9 


组 织 


本 书包 含 两 个 部 分 。 前 半 部 分 (第 1 ~5 章 ) 涵盖 了 计算 机 组 织 和 系统 结构 的 一 般 原理 ， 
以 及 汇编 语言 编程 的 艺术 /科学 ， 并 采用 了 JVM 作 为 例子 来 阐明 这 些 原理 如 何 起 作用 在 数字 
计算 机 中 如 何 表示 数 ? 加 载 器 做 哪些 事情 ? 格式 转换 涉及 哪些 事情 ?) ， 以 及 JVM 汇 编 语言 编 
程 中 一 些 必 要 的 细节 ， 包 括 对 操作 代码 的 详细 讨论 (操作 代码 12c 要 做 哪些 事情 ， 它 是 如 何 改 
变 堆 栈 的 ? 运行 汇编 器 的 命令 是 什么 ) 。 本 书 的 后 半 部 分 (第 6~ 10 章 ) 关注 于 各 种 不 同 CPU 
在 系统 结构 上 的 特殊 细节 ， 包 括 奔 腾 、 它 的 老 亲 威 8088、Power 系 统 结构 ， 以 及 作为 典型 谋 和 人 
式 系 统 控制 芯片 例子 的 Atmel AVR。 


日 “Computing Curricula 2001,”2001 年 12 月 15 日 ， 最 终 草 案 ， 特 别 参见 关于 课程 CS220 的 推荐 意见 。 


VI 


读者 

这 个 框架 将 使 得 本 书 被 广大 读者 和 众多 课程 所 使 用 ， 这 是 我 的 希望 和 信念 。 本 书 应 能 成 
功 地 服务 于 以 软件 为 中 心 的 计算 机 产业 。 对 于 那些 主要 感 兴趣 于 将 编程 语言 作为 基础 来 学 习 
抽象 的 计算 机 科学 的 人 来 说 ，JVM 对 计算 的 基本 操作 提供 了 一 个 简单 、 易 于 理解 的 介绍 。 作 
为 编译 器 理论 、 编 程 语 言 或 操作 系统 课程 的 基础 ，JVM 是 一 个 便利 和 可 移植 的 平台 和 目标 系 
统 结构 ， 比 任何 单 芯片 或 操作 系统 有 更 广 的 可 用 性 。 作 为 进一步 学 习 (特定 平台 的 ) 各 种 计 
算 机 的 基础 JVM 提供 了 一 个 有 用 的 解释 性 教学 系统 结构 ， 该 系统 结构 不 仅 可 向 目前 的 奔腾 ， 
而 且 可 向 在 未 来 可 能 取代 或 支持 奔腾 的 其 他 系统 结构 ， 实 现 平 滑 的 、 有 原则 的 过 渡 。 对 于 有 
兴趣 学 习 计算 机 如 何 工 作 的 学 生来 说 ， 本 书 将 提供 有 关 大 量 不 同 平台 的 信息 ， 以 增强 使 用 实 
际 计算 机 和 系统 结构 的 能 力 。 

如 上 所 述 ， 本 书 主要 是 作为 本 科 二 年 级 的 单 学 期 课程 的 教科 书 。 前 四 章 给 出 了 理解 计算 
机 组 织 、 系 统 结构 以 及 汇编 语言 编程 所 需 的 核心 材料 。 假 设 读者 已 经 有 了 高 级 命令 性 语言 能 
一 些 知识 ， 并 且 熟 悉 高 中 代数 (不 是 微 积分 )。 在 此 基础 上 ， 教 授 (和 学 生 ) 在 选择 主题 方面 
有 茶 种 程度 的 灵活 性 ， 这 取决 于 环境 和 具体 问题 。 对 于 Intel/Windows 工 作 组 ， 关 于 8088 和 奔 
腾 的 章节 就 是 有 用 和 相关 的 ， 而 对 于 有 老式 苹果 机 或 基于 Motorola 微 处 理 器 实验 室 的 学 校 ， 
关于 Power 系 统 结构 的 章节 更 为 相关 。 讲 述 Atmel AVR 的 一 章 可 为 修 入 式 系 统 或 微 计 算 机 实验 
室 工作 奠定 基础 ， 而 高 级 的 VM 课题 将 是 打算 以 JVM 系 统 结构 为 基础 实现 基于 JVM 的 系统 或 
编写 系统 软件 (编译 器 、 解 释 器 等 等 ) 的 学 生 之 兴趣 所 在 。 进 度 快 的 课程 甚至 可 能 会 涵盖 本 
书 所 有 的 主题 。 书 中 还 提供 了 附录 供 参 考 ， 因 为 我 们 相信 ， 好 的 教科 书 应 该 在 课程 结束 后 仍 
是 有 用 的 。 
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第 1 章 计算 和 表示 





一 台 计 算 机 也 是 一 台 计 算 机 


1.1.1 电子 设备 

有 多 少 人 真正 知道 计算 机 是 什么 ?如 果 你 问 这 个 问题 ， 大 多 数 人 会 指向 某 人 桌子 上 (或 
者 也 许 是 某 人 公文 包 中 ) 的 一 组 盒子 一 一 这 可 能 是 一 组 由 灰色 塑料 包装 的 、 外 形 呆 板 的 方形 
盒子 ， 并 且 纠 纺 了 一 堆 连 线 ， 类 似 于 一 台电 视 机 。 如 果 穷 追 细节 ， 他 们 会 指向 某 个 盒子 ， 称 
之 为 “计算 机 ”。 不 过 当然 也 有 计算 机 是 隐藏 在 各 种 日 常 电子 部 件 内 部 的 ， 它 们 的 作用 可 能 是 
确保 汽车 的 燃油 效率 足够 高 ， 解 释 来 自 PVD 播 放 机 的 信号 ， 其 至 是 确保 早餐 面包 烤 得 恰 到 好 
处 。 但 是 对 于 大 多 数 人 来 说 ， 计 算 机 仍然 是 你 从 电子 商店 购买 的 盒子 ， 并 且 还 要 常常 比较 其 
存储 量 (如 位 数 和 字 节 数 ) 和 频率 (如 千 兆赫 )， 但 很 少 有 人 真正 明白 其 含义 。 

用 功能 的 术语 来 说 ， 计 算 机 就 是 一 台 高 速 的 计算 器 ， 平 均 每 秒 能 执行 几 千 、 几 百 万 ， 甚 
至 几 十 亿 的 简单 算术 操作 ， 这 些 操作 由 存储 的 程序 所 规定 。 大 概 每 千 分 之 一 秒 左右 ， 汽 车 中 
的 计算 机 就 会 从 发 动机 中 的 各 个 传感器 读 取 一 些 关键 的 性 能 指示 数据 ， 并 对 汽车 进行 微调 以 
确保 运转 正常 。 该 功能 的 关键 至 少 有 某 些 部 分 是 在 传感器 中 ， 计 算 机 本 身 只 处 理 电信 号 。 传 
感 器 负责 确定 发 动机 究竟 运转 状况 如 何 ， 并 将 这 些 信息 转换 成 一 组 电信 号 ， 用 以 描述 或 表示 
发 动机 的 当前 状态 。 类 似 ,计算 机 所 做 的 调节 被 存储 为 电信 号 ， 并 被 转换 成 为 发 动机 工作 状 
况 的 实际 变化 。 

电信 号 如 何 能 “表示 ”信息 ?计算 机 如 何 精 确 地 处 理 这 些 信号 ， 以 达到 精细 的 控制 而 无 需 任 
何人 的 干涉 ? 这 种 表示 问题 就 是 理解 计算 机 如 何 工作 以 及 如 何在 现实 世界 中 部 署 计算 机 的 关键 。 


1.1.2 算法 机 
计算 机 操作 方面 的 最 重要 的 概念 就 是 算法 (algorithm): 算法 就 是 一 个 明确 的 、 按 步 进 行 
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的 过 程 ， 用 以 解决 某 个 问题 或 达到 某 个 期 望 目标 。 计 算 机 的 最 终 定义 不 依赖 于 其 物理 特性 ， 
其 至 也 不 依赖 于 其 电学 特性 (如 其 晶体 管 )， 而 是 依赖 于 其 表示 和 完成 算法 的 能 力 ， 这 些 算法 来 
源 于 存储 的 程序 。 在 计算 机 内 部 是 数 以 百 万 计 的 微小 电路 ， 每 个 电路 在 被 调用 时 都 执行 一 个 
特定 的 、 明 确定 义 的 任务 (如 将 两 个 整数 相 加 、 使 单个 或 一 组 线 通 电 )。 大 多 数 使 用 计算 机 或 
者 为 计算 机 编程 的 人 都 不 知道 这 些 电路 的 工作 细节 。 

特别 是 ， 一 个 典型 的 计算 机 能 执行 若干 个 基本 类 型 的 操作 。 由 于 计算 机 从 根本 上 看 只 是 
计算 机 器 ， 所 以 它 能 执行 的 几乎 所 有 功能 都 与 数字 (以 及 用 数字 表示 的 概念 ) 相关 。 一 个 计 
算 机 通常 能 执行 诸如 加 法 和 除法 等 基本 的 数学 操作 。 它 也 能 执行 基本 的 比较 操作 ， 如 一 个 数 
字 与 另 一 个 数字 相等 吗 ? 第 一 个 数字 小 于 第 二 个 数字 吗 ? 它 能 存储 几 百 万 或 几 十 亿 的 信息 片 
断 ， 并 能 单独 地 获取 。 最 后 ， 它 能 根据 获取 到 的 信息 和 执行 比较 的 结果 来 调整 其 动作 。 比 如 ， 
如 果 获 取 到 的 值 大 于 以 前 的 值 ， 则 说 明 发 动机 正在 过 热 的 情况 下 运行 ， 需 要 发 一 个 信号 来 调 
节 其 性 能 。 


1.1.3 功能 部 件 

系统 级 描述 

几乎 任何 大 学 的 公告 板 上 都 有 这 样 一 些 广 告 ， 如 “超级 计算 机 ! 3.0-GHz Intel Celeron D， 
512mg, 80-GB 硬 驱 ，15 英 寸 显 示 器 ， 为 抵 汽车 款 忍 痛 割 爱 ! ”。 像 大 多 数 广 告 一 样 ， 许 多 信息 
需要 深入 地 解读 才能 理解 其 全 部 意思 。 例 如 ，15 英 寸 显示 器 的 哪个 部 分 才 真 正 是 15 英 寸 ? 
(显示 屏 对 角 线 的 长 度 ， 够 奇怪 的 了 ) 。 为 了 理解 计算 机 的 工作 细节 ， 我 们 首先 必须 理解 主要 
的 部 件 以 及 它们 相互 之 间 的 关系 ( 见 图 1-1)。 





图 1-1 一 台 计 算 机 的 主要 硬件 部 件 


中 央 处 理 单元 

计算 机 的 心脏 就 是 中 央 处 理 单 元 (Central Processing Unit)， 即 CPU。 这 通常 是 制造 在 单 
个 集成 电路 (Integrated Circuit, IC) 硅 片 上 的 一 个 高 密度 电路 ( 见 图 1-2)。 它 通常 看 起 来 就 
像 一 小 块 硅 片 ， 安 置 在 一 个 几 平方 厘米 并 由 金属 管 脚 包围 着 的 塑料 厚 片 上 。 塑 料 厚 片 本 身 座 
还 在 一 个 母 板 (motherboard) 上 ， 母 板 就 是 一 个 电子 电路 板 ， 由 一 块 塑料 和 金属 组 成 ， 每 个 面 
几 十 平方 厘米 ， 包 含 了 CPU 和 其 他 一 些 部 件 ， 这 些 部 件 因 速 度 和 便利 等 原因 而 需要 安置 在 靠 
近 CPU 的 地 方 。CPU 是 计算 机 的 最 终 控制 器 ， 也 是 执行 所 有 计算 的 地 方 。 当 然 ， 这 也 是 人 们 
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谈论 计算 机 时 所 指 的 部 分 ， 比 如 :“3.60GHz 奔 膳 4 计算 机 ， 如 惠普 HP xw4200”， 就 是 指 这 样 
的 一 台 计 算 机 : 它 的 CPU 是 奔腾 4 芯片 ， 运 行 速度 为 3.6 千 兆赫 兹 (GHz)， 即 每 秒 3 600 000 000 
个 机 器 周期 (machine cycle)。 计 算 机 的 多 数 基 本 操作 需要 一 个 机 器 周期 ， 所 以 另外 一 种 描述 方 
式 就 是 3.60GHz 计 算 机 能 在 每 秒 执行 超过 35 亿 个 基本 操作 。 在 写本 书 的 时 候 ，3.6GHz 是 速度 
很 快 的 机 器 ， 但 随 着 工艺 进步 ， 情 况 变化 很 快 。 例 如 ， 在 2000 年 ，1.0GHz 奔 腾 是 最 先进 的 ， 
根据 计算 能 力 每 18 个 月 翻 一 番 这 一 长 期 证 明 有 效 的 经 验 (摩尔 定律 ) ， 我 们 可 以 预测 8gGHz 
CPU 在 2008 年 将 会 普及 。 





图 1-2 CPU 世 片 的 照片 


CPU 通常 以 工艺 发 展 的 系列 来 描述 ， 例 如， 奔腾 4 是 奔腾 、 奔 腾 2 及 奔腾 3 的 进一步 发 展 ， 
都 是 Intel 公 司 生产 的 。 在 这 之 前 ， 奔腾 本 身 衍生 于 一 长 串 用 数字 编号 的 Intel 芯 片 ， 开 始 于 Intel 
8088， 并 发 展 到 80286、80386 及 80486。 这 个 所 谓 的 “x86 系 列 ” 就 成 为 最 畅销 的 BM 个 人 计 
算 机 (PC 机 及 其 模仿 机 ) 的 基础 ， 并 且 可 能 是 最 广泛 使 用 的 CPU 芯片 。 现 代 苹果 计算 机 采用 
了 一 个 不 同系 列 的 芯片 ， 即 PowerPCG3 和 G4， 该 系列 芯片 由 苹果 、 IBM 及 Motorola 组 成 的 联 
盟 (AIM) 所 制造 。 较 早 的 苹果 和 Sun 工 作 站 采用 了 Motorola 设 计 的 68000 系 列 艺 片 。 

CPU 本 身 可 分 为 两 个 或 三 个 主要 的 功能 部 件 。 控 制 单 元 (Control Unib 和 负责 在 计算 机 内 移 
动 数据 。 例 如 ， 控 制 单元 要 从 存储 器 中 装 入 单个 程序 指令 ， 辨 别 各 指令 的 功能 ， 并 将 指令 传 
递 到 计算 机 的 其 他 部 分 来 执行 。 算 术 和 逻辑 单元 (ALU) 为 计算 机 执行 所 有 必需 的 算术 运算 。 
它 通常 包含 完成 加 法 、 乘 法 、 除 法 等 的 特殊 用 途 硬 件 。 顾 名 思 义 ， 它 还 执行 所 有 的 逻辑 操作 ， 
确定 一 个 给 定 的 数 是 否 大 于 或 小 于 另外 一 个 数 ， 或 者 检查 两 个 数 是 否 相等 。 一 些 计算 机 ( 特 
别 是 较 旱 的) 有 专用 的 硬件 ， 有 时 安置 在 与 CPU 不 同 的 芯片 上 ， 用 于 处 理 涉 及 分 数 和 小 数 的 
操作 。 这 个 特殊 的 硬件 通常 称 为 浮 点 单元 或 FPU (也 称 为 浮 点 处 理 器 或 FPP)。 其 他 计算 机 将 
FPU 硬 件 放 在 ALU 和 控制 单元 所 在 的 同一 个 芯片 上 ， 但 FPU 仍 可 看 作 是 同一 电路 系统 内 部 的 
不 同 模块 。 

存储 器 6 

要 执行 的 程序 和 其 数据 都 存放 在 存储 器 中 。 在 概念 上 ， 存储 器 可 看 作 是 一 个 非常 长 的 一 
列 或 一 排 的 电磁 存储 器 件 。 这 些 列 的 位 置 从 0 到 CPU 定 义 的 最 大 数 进行 编号 ， 可 由 控制 单元 单 
独 地 寻 址 ， 将 数据 置 人 存储 器 或 将 数据 从 存储 器 中 取 回 (图 1-3)。 此 外 ， 多 数 的 现代 计算 机 
都 多 许 像 磁盘 驱动 器 这 样 的 高 速 设备 拷贝 大 块 的 数据 而 无 需 对 每 个 信号 都 要 控制 单元 介入 。 
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存储 器 可 宽泛 地 分 为 两 种 类 型 ， 只 读 存 储 器 (ROM) ， 这 是 永久 的 、 不 可 改变 的 ， 甚 至 在 电 
源 关 闭 后 数据 仍 保留 ， 随 机 存 取 存储 器 (RAM) ， 其 内 容 可 被 CPU 改变 ， 是 作为 临时 存储 器 
但 通常 在 电源 关闭 后 数据 消失 。 很 多 机 器 中 同时 有 这 两 种 存储 器 。ROM 保 存 标 准 化 的 数据 和 
操作 系统 基本 版 本 ， 用 于 启动 机 器 。 更 多 程序 保存 在 像 磁盘 驱动 器 和 CD 这 样 的 长 期 存储 器 中 ， 
并 在 需要 时 被 装 入 RAM 中 用 于 短期 存储 和 执行 。 


补充 资料 
摩尔 定律 

Intel 的 共同 创始 人 戈 登 . 摩尔 在 1965 年 观察 到 ， 能 放置 到 一 个 芯片 上 的 晶体管 数量 每 
年 翻 一 番 。 在 20 世 纪 70 年 代 ， 这 个 步伐 稍微 变 慢 了 ， 成 为 每 18 个 月 翻 一 番 。 但 令 每 个 人 包 
括 摩尔 博士 本 人 吃惊 的 是 ， 从 此 这 个 步伐 就 异 平 寻常 地 均匀 。 仅 仅 在 刚 过 去 的 几 年 这 个 步 
伐 才 减 慢 。 

更 小 的 晶体 管 〈 相 应 的 晶体 管 密度 更 大 ) 所 蕴涵 的 意义 是 深远 的 。 首 先 ， 硅 片 本 身 每 
平方 英寸 的 成 本 比较 而 言 已 经 相对 稳定 了 ， 所 以 密度 加 们 就 使 芯片 的 成 本 近似 减 半 。 其 次 ， 
更 小 的 晶体 管 反应 更 快 ， 并 且 部 件 能 更 紧密 地 放置 在 一 起 ， 所 以 它们 能 更 快 地 相互 通信 ， 
极 大 地 提高 了 芯片 速度 。 较 小 的 晶体 管 也 消耗 较 少 的 功 耗 ， 这 意味 着 更 长 的 电池 寿命 和 较 
低 的 散热 要 求 ， 吉 免 了 对 房间 气温 控制 及 庞大 电 扁 的 需求 。 由 于 更 多 的 晶体 管 可 放置 到 一 
个 芯片 上 ， 就 需要 较 少 的 焊接 以 将 芯片 连接 到 一 起 ， 因 而 就 降低 了 焊接 破损 的 机 会 ， 相 应 
地 也 就 极 大 地 提高 了 总 体 可 靠 性 。 最 后 , 苞 片 更 小 的 事实 意味 着 计算 机 本 身 可 以 做 得 更 小 ， 
小 到 足以 使 谋 入 式 控制 总 片 和 /或 个 人 数字 助理 (PDA) 这 些 思想 成 为 现实 。 很 难 预 测 麻 
尔 定律 对 现代 计算 机 的 发 展 产生 多 大 影响 。 到 目前 ， 摩 尔 定律 通常 就 是 简单 地 用 来 表明 计 
算 机 的 能 力 在 每 18 个 月 翻 一 番 (不 管 什 么 原因 ， 不 仅仅 是 晶体 管 密度 ) 。 一 个 当地 商店 下 
架 的 标准 的 、 甚 至 低 端 的 计算 机 就 比 1973 年 的 原始 Cary-1 超 级 计算 机 更 快 、 更 可 靠 ， 并 且 
有 更 多 的 内 存 。 

摩尔 定律 的 问题 是 它 不 会 永远 保持 。 最 终 ， 物 理 定律 指出 ， 鼎 体 管 不 能 小 于 一 个 原子 
(或 类 似 的 东西 )。 更 令 人 不 安 的 是 摩尔 第 二 定律 指出 制造 成 本 在 每 3 年 翻 一 番 。 只 要 制造 
成 本 增加 的 速度 比 计算 机 能 力 增长 的 速度 慢 ， 性 能 /成 本 比 就 应 该 保持 合理 。 但 是 ， 投 资 
新 的 芯片 工艺 的 成 本 很 大 ， 可 能 会 使 Intel 这 样 的 制造 商 继 续 投 入 新 的 资本 变 得 困难 。 


这 个 简化 的 描述 故意 隐藏 了 存储 器 的 一 些 繁杂 方 

面 ， 遂 常 硬件 和 操作 系统 为 用 户 处 理 这 些 方面 。( 这 些 

问题 也 趋向 于 与 硬件 相关 ， 所 以 将 在 后 面 章节 详细 讨 

论 。) 例如 ， 不 同 的 计算 机 ， 即 使 有 相同 的 CPU， 也 常 

常 有 不 同 数 量 的 存储 器 。 安 置 在 计算 机 上 的 物理 存储 器 

可 少 于 CPU 能 寻 址 的 最 多 位 置 数 ， 但 在 特定 情况 下 ， 却 

可 能 多 于 CPU 能 寻 址 的 最 多 位 置 数 。 进 一 步 地 ， 处 于 

CPU 芯片 本 身 的 存储 器 通常 可 以 比 处 于 不 同 芯片 上 的 存 

储 器 以 快 得 多 的 速度 访问 ， 所 以 ， 一 个 好 的 系统 应 努力 

确保 数据 需要 移动 或 拷贝 时 能 在 最 快 的 存储 器 中 得 到 。 CO 
输入 /输出 (1/O) 外 设 机 器 定义 的 最 大 存储 单元 
除了 CPU 和 存储 器 ， 一 台 计 算 机 通常 还 包含 其 他 图 1-3 线性 排列 的 存储 器 单元 的 示意 图 
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设备 用 来 读 、 显 示 或 存储 数据 ， 或 者 更 一 般 地 与 外 部 世界 交互 作用 。 这 些 设备 多 种 多 样 ， 从 
普通 的 键盘 和 硬盘 驱动 器 ， 到 并 不 普通 的 设备 如 传真 (FAX) 板 、 话 简 及 音乐 键盘 ， 再 到 相 
当 怪 异 的 小 配件 像 化 学 传感器 、 机 器 人 手 敬 及 安全 门 挫 。 这 些 部 件 的 一 般 术语 就 是 外 设 
(peripheral) 。 在 很 大 程度 上 ， 这 些 设备 对 计算 机 本 身 的 体系 结构 和 组 织 儿 乎 没有 直接 的 影响 ， 
它们 只 是 信息 的 源 点 和 终点 。 例 如 ， 键 盘 只 是 一 个 让 计算 机 从 用 户 那 里 获取 信息 的 设备 。 从 
CPU 设计 者 的 角度 看 ， 数 据 就 是 数据 ， 不 管 它 来 自 于 因特网 ， 来 自 于 键盘 ， 还 是 来 自 于 奇特 
的 化 学 频谱 分 析 仪 。 

在 很 多 情况 下 ， 一 个 外 设 可 在 物理 上 分 为 两 个 或 更 多 的 部 分 。 例 如 ， 计 算 机 通常 在 某 种 
形式 的 视频 监视 器 上 将 其 信息 显示 给 用 户 。 监 视 器 (monitor) 本 身 就 是 一 个 独立 的 设备 ， 通 
过 电缆 连接 到 计算 机 机 箱 内 部 的 视频 适 配 板 上 。CPU 画 图 时 ， 可 发 送 命令 信号 给 视频 板 ， 视 
频 板 生成 图 形 并 通过 视频 电缆 将 适当 的 视觉 信号 发 送 到 监视 器 本 身 。 可 以 用 类 似 的 过 程 描述 
计算 机 如 何 通过 一 个 SCSI (Small Computer System Interface) 控制 器 卡 从 很 多 不 同 种 类 的 硬 
盘 驱 动 器 装 入 一 个 文件 ， 或 者 通过 一 个 以 太 网卡 与 构成 因特网 的 数 百 万 英里 的 线 交 互 作用 。 
在 概念 上 ， 工 程 师 们 会 对 设备 本 身 、 设 备 电缆 (通常 只 是 一 条 线 ) 及 设备 控制 器 (通常 是 计 
算 机 内 部 的 一 块 板 ) 加 以 区 分 ， 但 对 于 程序 员 ， 它 们 通常 从 总 体 上 就 被 看 作 是 一 个 设备 。 根 
据 这 种 逻辑 ， 整 个 因特网 连同 其 数 百 万 英里 的 线 就 只 是 “一 个 设备 ”。 对 于 一 个 设计 良好 的 系 
统 ， 从 因特网 下 载 一 个 文件 与 从 一 个 硬盘 驱动 器 装 入 一 个 文件 之 间 没 有 多 大 区 别 。 

互 连 和 总 线 

为 了 使 数据 在 CPU、 存 储 器 以 及 外 设 之 间 和 移动， 必须 存在 连接 。 这 些 连接 (特别 是 独立 
的 板 之 间 的 连接 ) 通常 是 成 组 的 线 ， 使 得 多 个 单独 的 信号 能 成 组 发 送 。 例 如 ， 最 初 的 IBM-PC 
有 8 条 线 在 CPU 和 外 设 之 间 传 递 数 据 。 一 台 更 现代 的 计算 机 的 PCI (Peripheral Component 
Interconnect) 总 线 有 64 条 数据 线 ， 即 使 不 考虑 计算 机 速度 的 提高 ， 也 能 使 数据 以 8 倍 的 速率 传 
递 。 这 些 线 通 常 组 合 起 来 形成 总 线 (bus) ， 总 线 就 是 连接 若干 不 同 设备 的 线 的 集合 。 由 于 总 
线 是 共享 的 (就 像 早期 的 共 线 电话 )， 一 次 只 有 一 个 设备 能 传送 数据 ， 但 连接 的 所 有 设备 都 可 
得 到 数据 。 一 些 附加 信号 用 于 确定 哪个 设备 应 该 得 到 数据 以 及 当 它 得 到 数据 时 应 该 做 些 什么 。 

一 般 来 说 ， 连 接 到 单个 总 线 的 设备 越 多 ， 运 行 就 越 慢 。 这 有 两 个 原因 。 首 先 ， 设 备 越 多 ， 
在 相同 时 间 两 个 设备 要 同时 传送 数据 的 可 能 性 就 越 大 ， 因 此 一 个 设备 就 要 等 待 轮 到 自己 传送 。 
其 次 ， 更 多 的 设备 通常 意味 着 总 线 更 长 ， 由 于 传播 有 延迟 ( 即 信号 从 线 的 一 端 到 达 另 一 端的 
时 间 )， 因 而 就 降低 了 总 线 的 速度 。 由 于 这 个 原因 ， 很 多 计算 机 现在 采取 多 总 线 设 计 ， 例 如 ， 
局 部 总 线 连接 CPU 和 CPU 母 板 上 的 高 速 存 储 器 (通常 置 于 CPU 芯片 本 身 ) ， 系 统 总 线 连 接 存 储 
器 板 、CPU 母 板 以 及 一 个 “扩展 总 线 ” 接 口 板 ， 而 扩展 总 线 又 是 一 个 连接 网 络 、 磁 盘 驱动器 、 
键盘 及 鼠标 的 二 级 总 线 。 

在 个 别 的 高 性 能 计算 机 上 (如 图 1-4 所 示 的 计算 机 )， 可 能 有 4 到 5 条 独立 的 总 线 ， 一 条 保 
留用 于 高 速 、 数 据 密集 的 设备 ， 如 网 络 和 视频 卡 ， 而 低速 设备 如 键盘 则 归 和 人 另外 的 低速 总 线 
处 理 。 

支持 单元 

除了 已 经 提 到 的 设备 ， 一 个 典型 的 计算 机 还 有 一 些 对 保证 其 物理 条 件 很 重要 的 部 件 。 例 
如 ， 在 机 箱 内 部 (机 箱 本 身 也 是 对 易 损 电 路 板 的 重要 物理 保护 ) 有 一 个 供电 电源 ， 用 于 将 交 
流 电压 转换 成 可 用 于 电路 板 的 适当 调节 的 直流 电压 。 还 可 能 有 一 个 电池 ， 尤 其 在 便携 式 电脑 
中 ， 用 于 在 没有 墙壁 插座 提供 电流 时 提供 电源 并 保持 存储 器 的 设置 。 通 常 还 有 一 个 风 扁 用 来 
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存储 器 
CPU 桥 
存储 器 总 线 
SCSI 总 线 
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Ey rm Wa WA 
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图 1-4 高 速 多 总 线 计算 机 的 体系 结构 示意 图 


对 机 箱 内 部 通风 以 防止 部 件 过 热 。 可 能 还 有 其 他 一 些 设备 ， 如 热 传 感 器 〈 用 于 控制 风扇 速度 )、 
用 于 防止 未 授权 的 使 用 和 拆 印 的 安全 设备 ， 常 常 还 有 若干 个 完全 内 部 使 用 的 外 设 如 内 部 磁盘 
驱动 器 和 CD 阅读 器 。 


1.2 数字 和 数值 表示 


1.2.1 数字 表示 和 位 

在 最 基本 的 层次 ， 计 算 机 部 件 像 很 多 其 他 电子 部 件 一 样 有 两 个 状态 。 灯 或 者 开 或 者 关 ， 
开关 或 者 打开 或 者 关闭 ， 线 路 或 者 正 携带 电流 或 者 未 携带 电流 。 对 于 计算 机 硬件 ， 各 个 部 件 
如 晶体 管 和 电阻 器 相对 于 地 或 者 处 于 0 电压 或 者 处 于 某 个 其 他 电压 〈 典 型 值 是 对 地 有 5 伏特 电 
压 ) 。 这 两 个 状态 通常 用 来 分 别 表示 数字 1 和 0。 在 计算 机 发 展 的 早期 阶段 ， 这 些 值 是 通过 翻转 
机 械 开关 来 进行 手工 编码 的 。 现 在 ， 高 速 晶 体 管 实 现 的 是 几乎 同样 的 意图 ， 但 数据 用 这 两 个 
值 来 表示 自 上 世纪 四 十 年 代 以 来 一 直 未 改变 。 每 个 这 样 的 1 或 0 通常 称 为 位 或 比特 (bit) ， 是 
“binary digit” 的 简写 。( 当 然 ,“bit” 本 身 是 一 个 标准 的 英文 词 ， 意 思 是 “一 个 很 小 的 量 ， 
这 也 描述 了 “一 小 部 分 ”的 信息 )。 


补充 资料 





晶体 管 如 何 工作 
在 现代 计算 机 中 最 重要 的 电子 部 件 是 晶体 管 ， 晶 体 管 是 由 Bardeen、Brattain 和 
Shockley 于 1947 在 贝尔 电话 实验 室 发 明 的 。( 这 些 人 因为 这 项 发 明 而 获得 了 1956 年 的 诺 贝 
尔 物理 学 奖 )。 它 的 基本 思想 涉及 一 些 相当 高 级 的 (是 的 ， 诺 贝尔 档次 的 ) 量子 物理 学 ， 
但 是 ， 不 需要 具体 的 公式 ， 你 也 能 根据 电子 迁移 的 原理 来 理解 它 。 一 个 晶体 管 主要 包含 了 
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一 种 称 为 半导体 (semiconductor) 的 材料 ， 它 处 于 好 导体 (如 铜 ) 和 坏 导 体 / 好 绝缘 体 
(如 玻璃 ) 之 间 的 不 稳定 的 中 间 状 态 。 半 导体 的 一 个 关键 方面 是 其 导电 能 力 会 随 半 导体 中 
杂质 ( 掺 杂 物 ，dopant) 的 不 同 而 显著 变化 。 

例如 ， 当 元 素 磷 被 加 入 到 纯 硅 (一 种 半导体 ) 时 ， 将 为 硅 提 供电 子 。 由 于 电子 带 负 电 ， 
磷 就 称 为 n 型 (n-type) 挫 杂 物 ， 而 用 磷 迭 杂 过 的 硅 就 叫做 n 型 半导体 (n-type 
semiconductor)。 与 此 相反 ， 铝 是 一 种 p 型 (p-type) 掺 杂 物 ， 从 硅 阵列 中 移出 (实际 上 是 
锁定 ) 电子 。 在 p 型 半导体 中 ， 这 些 电子 被 移出 的 地 方 有 时 称 为 “ 空 穴 "。 

当 将 一 块 na 型 半导体 与 一 块 p 型 半导体 紧 挨 着 放 在 一 起 时 〈 所 形成 的 小 器 件 称 为 二 极 管 
(diode)， 见 图 1-5)， 就 会 发 生 有 趣 的 电 效 应 。 电 流 一 般 不 能 穿 过 这 样 的 二 极 管 ， 载 流 的 电 
子 将 遭遇 并 “陷入 ” 空 穴 。 然 而 ,如果 你 将 一 个 偏 置 电压 (bias voltage) 施加 于 这 个 器 件 ， 
额外 的 电子 将 填充 空 穴 ， 使 得 电流 通过 。 这 意味 着 电流 只 能 在 一 个 方向 穿 过 二 极 管 ， 使 得 
其 具有 电 整 流 器 (rectifier) 的 用 途 。 


二 级 管 的 符号 
图 1-5 二 级 管 


现代 的 晶体 管 做 得 就 像 一 个 半导体 三 明治 ， 就 是 一 个 p 型 半导体 薄 层 处 于 两 薄片 的 n 型 半 导 
体 之 间 。( 是 的 ， 这 就 是 两 个 背靠背 的 二 极 管 ， 见 图 1-6) 。 在 常态 环境 下 ， 电 流 不 能 从 发 射 极 
(emitter) 到 集 电 极 (collector) 穿 过 ， 因 为 电子 陷入 到 空 穴 中 。 将 偏 置 电压 施加 到 基 极 (base) 
(中 间 的 线 ) 就 将 填充 空 穴 使 得 电流 能 通过 。 你 可 以 将 基 极 看 作 一 个 可 开关 的 门 ， 使 得 电流 能 
流 过 或 不 能 通过 。 或 者 ， 你 也 可 以 将 其 看 作 是 橡胶 软 管 中 的 一 个 阀门 , 用 以 控制 通过 的 水 流量 。 
将 阅 门 转 到 一 个 方向 ， 电 信号 就 减 小 到 很 微弱 ， 转 到 另 一 个 方向 ， 就 无 阻碍 地 流动 。 


四 四 四 


NPN 唱 体 管 


基 极 | 晶体 管 的 另 一 种 符号 
晶体 管 符号 





图 1-6 章 体 管 
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晶体 管 的 总 体 效应 是 (在 基 极 ) 电压 的 小 的 变化 将 导致 从 发 射 极 到 集 电极 流 过 电流 量 
的 很 大 变化 。 这 使 得 晶体 管 在 放大 小 信号 方面 极为 有 有 用。 晶体管 还 可 作为 二 进 制 开 关 使 用 ， 
其 关键 优势 是 没有 移动 部 件 因而 不 会 有 损坏 。 利 用 集成 电路 的 发 明 ，Jack Kilby 也 因此 赢 


得 了 庶 贝 尔 奖 ,工程师 们 通过 在 更 大 硅 片 上 利用 很 小 块 的 区 域 而 获得 了 生成 数 千 、 数 百 万 、 
或 数 十 亿 微 小 晶体 管 的 能 力 。 直 至 现在 ， 这 仍然 是 制造 计算 机 的 主要 方式 。 





1.2.2 布尔 逻辑 

现代 计算 机 采用 基于 位 (bit) 的 逻辑 来 操作 。 一 个 位 是 就 是 携带 信息 的 最 小 单位 ， 就 像 
儿童 游戏 “二 十 个 问题 ”中 的 问题 ， 每 个 问题 的 答案 为 “是 ”或 者 “ 否 "， 这 样 每 个 问题 的 答 
案 都 可 编码 成 一 个 位 〈 例 如 ，1 表 示 “ 是 ”，0 表 示 “ 否 " ) 。 如 果 你 熟悉 早期 的 Milton Bradley 
Board 游 戏 “ 猜 猜 我 是 谁 ”"， 也 是 同样 一 个 道理 。 如 果 询 问 是 / 否 的 问题 ， 你 就 逐渐 知道 了 你 的 
对 手 选 择 了 谁 ， 并 且 通 过 记录 问题 的 答案 ， 你 可 在 任何 时 候 再 现 学 习 到 的 东西 。 因 此 ， 一 个 
位 就 是 可 处 理 (存储 、 传 送 或 操作 ) 的 最 小 单位 。 对 用 位 表示 的 量 进行 操作 的 传统 方式 称 为 
布尔 (Boolean) 逻辑 ， 这 是 以 十 九 世 纪 数 学 家 乔治 . 布尔 来 命名 的 。 他 确定 了 基本 的 操作 : 
AND (与 )、OR (或 ) 和 NOT ( 非 )， 并 以 对 位 的 简单 变化 定义 了 它们 的 含义 。 例 如 ， 表 达 式 
X AND Y 为 真 (也 可 称 为 “是 ”或 者 1) 当 且 仅 当 X 和 Y 都 为 “是 ”"。 相 反 地 ， 倘 车 表 达 式 X 
OR Y 为 “是 ， 只 要 X 为 “是 ”或 者 Y 为 “是 ” 即 可 。 与 此 等 价 的 陈述 是 : X OR Y 为 假 (“ 否 ” 
或 者 0) 当 且 仅 当 X 和 Y 都 为 “ 否 ”。 表 达 式 NOT X 就 是 X 的 反面 ， 当 X 为 “ 否 ” 时 它 为 “是 ”， 
X 为 “是 ”时 它 为 “ 否 ”( 见 图 1-7)。 因 为 一 个 位 只 能 处 于 两 种 状态 之 一 ， 所 以 无 需 考 虑 其 他 
的 可 能 性 。 这 些 操作 (AND、OR 及 NOT) 可 根据 需要 风 套 或 结合 。 例 如 ,，NOT (NOT (X)) 
就 是 对 X 取 反 后 再 取 反 ， 结 果 就 是 X 本 身 。 这 三 种 操作 与 它们 对 应 的 英文 词汇 有 很 好 的 对 应 关 
系 : 如 果 我 想 要 一 杯 “ 有 牛奶 和 糖 ” 的 咖啡 ， 在 逻辑 上 ， 我 想 要 的 就 是 一 杯 “ 有 牛奶 ”条 件 
为 真 并 且 “ 有 糖 ”条 件 为 真 的 匣 啡 。 类 似 地 ， 一 杯 “ 没 有 牛奶 或 糖 ”的 暑 啡 与 一 杯 “ 没 有 牛 
奶 并 且 没 有 糖 ” 的 咖啡 是 一 个 意思 。( 可 以 对 这 个 问题 多 做 一 些 考虑 。) 


AND 否 是 OR 否 是 NOT 
否 否 否 否 否 是 否 是 
是 否 是 是 是 是 是 否 


图 1-7 AND、OR 及 NOT 的 真 值 表 


除了 这 三 种 基本 的 操作 ， 还 有 根据 这 些 基 本 操作 定义 的 一 些 其 他 操作 。 例 如 ，NAND 是 
NOTAND 的 缩写 。 表 达 式 X NAND Y 就 是 指 NOT (X AND Y)。 类 似 地 ，X NOR Y 就 是 指 NOT 
(X OR Y)。 另 一 个 常见 的 表达 式 是 异 或 (exclusive-OR) ， 写 成 XOR。 表 达 式 X OR Y 为 真 ， 则 
X 为 真 ， 或 Y 为 真 ， 或 者 两 者 都 为 真 。 对 比 之 下 ，X XOR Y 为 真 ， 则 X 为 真 ， 或 Y 为 真 ， 但 不 能 
两 者 都 为 真 。 这 个 差异 在 英文 中 没有 明确 地 表达 出 来 ， 而 隐 含 在 一 些 不 同 的 用 法 中 。 例 如 ， 如 
果 我 被 问 到 我 的 咖啡 中 是 否 需要 牛奶 或 糖 ， 我 可 能 说 “好 的 ”， 意 思 是 我 两 者 都 要 。 这 是 正常 
的 (inclusive) OR 的 意思 。 与 此 不 同 的 是 ， 如 果 问 我 要 咖啡 还 是 茶 ， 我 若 说 “好 的 ”来 表示 两 
者 都 要 就 不 很 恰当 。 这 是 一 个 (exclusive) OR， 我 能 要 咖啡 XOR 茶 ， 但 不 能 同时 两 者 都 要 。 

从 严格 的 理论 观点 看 ， 将 1/“ 是 ”/“ 真 ”编码 为 地 电压 还 是 编码 为 对 地 5 伏 电 压 没有 多 大 关 
系 ， 只 要 将 0/“ 否 ”/“ 假 ”总 是 编码 成 与 之 不 同 的 值 即 可 。 从 计算 机 工程 师 或 系统 设计 者 的 观 
点 看 ， 就 可 能 有 特定 的 原因 (如 功 耗 ) 来 选择 一 种 表示 而 不 选择 另 一 种 。 表 示 法 的 选择 对 芯片 
设计 本 身 会 有 深远 的 影响 。 上 面 描述 的 布尔 操作 通常 在 芯片 非常 低 的 层次 上 用 硬件 实现 。 例 如 ， 
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我 们 可 以 用 一 对 开关 〈 晶 体 管 ) 建立 一 个 简单 的 电路 ， 使 得 只 有 在 两 个 开关 都 关闭 的 情况 下 电 
流 才 能 流 过 。 这 样 一 个 电路 称 为 与 《AND) 门 ， 因 为 它 对 表示 成 开关 状态 的 2 个 位 实现 了 AND 
的 功能 。 这 个 微小 电路 与 其 他 类 似 的 电路 (OR 门 ，NAND 门 等 等 ) 一 样 ， 在 计算 机 芯片 上 要 复 
制 几 百 万 或 几 十 亿 次 ， 是 计算 机 的 基本 构件 块 。( 关 于 这 些 门 如 何 工作 的 更 多 信息 参见 附录 A。) 


1.2.3 字 节 和 字 

为 方便 起 见 ，8 个 位 通常 组 合成 一 块 ， 传 统 上 称 为 字 节 (byte)。 这 样 做 主要 有 两 个 优势 。 
首先 ， 对 于 人 来 说 ， 读 写 一 个 长 长 的 0/1 序 列 很 乏味 且 容 易 出 错 。 其 次 ， 大 多 数 有 意义 的 计算 都 
要 求 多 位 的 数据 。 如 果 有 像 标准 总 线 那样 的 多 条 线 ， 则 电信 号 可 成 组 移动 ， 实现 更 快 的 计算 。 

下 一 个 命名 位 块 称 为 字 (word) 。 字 的 定义 和 大 小 不 是 绝对 的 ， 而 是 随 计算 机 的 不 同 而 变 
化 。 一 个 字 就 是 计算 机 最 便于 处 理 的 数据 块 大 小 。( 虽 然 不 总 是 如 此 ， 但 通常 都 是 通 向 主 存储 
器 的 总 线 大 小 。 但 是 后 面 要 讨论 的 Intel 8088 是 一 个 反例 。) 例如 ，Zilog Z-80 微 处 理 器 (作为 
Radio Shack TRS-80 的 基础 芯片 ， 在 20 世 纪 七 十 年 代 中 期 流行 ) 的 字 大 小 是 8 位 ， 即 一 个 字 节 。 
CPU、 存 储 器 及 总 线 都 已 优化 为 一 次 处 理 8 位 。( 例 如 ， 系 统 总 线 中 有 8 条 数据 线 )。 当 计算 机 
必须 要 处 理 16 位 数据 时 ， 就 要 分 两 部 分 分 别处 理 。 而 如 果 计 算 机 只 有 4 位 数据 要 处 理 时 ，CPU 
就 像 处 理 8 位 数据 一 样 工作 ， 然 后 抛弃 额外 4 个 无 用 的 位 。 原 始 的 IBM PC 是 基于 Intel 8088 芒 
的 ， 有 16 位 大 小 的 字 。 更 现代 的 计算 机 如 Intel 奔腾 4 或 者 PowerPC G4 有 32 位 大 小 的 字 。 有 64 
”位 或 更 大 字 的 计算 机 如 Intel Itanium 和 AMD Operon 系 列 也 已 经 出 现 了 。 尤其 对 于 高 端 科学 计 
算 或 图 形 学 ， 如 家 庭 视频 游戏 控制 台 ， 字 的 大 小 会 成 为 能 否 以 足够 快 的 速度 传送 数据 以 支持 
平滑 变化 的 高 精细 度 图 形 的 关键 。 | 

正式 地 讲 ， 计 算 机 字 的 大 小 定义 为 其 寄存 器 (register) 的 大 小 (用 位 数 表示 )。 寄 存 器 是 
CPU 内 部 实际 进行 如 加 、 减 、 及 比较 等 计算 的 存储 位 置 (图 1-8)。 寄 存 器 的 数量 、 类 型 及 组 织 对 
于 不 同 的 艺 片 变化 很 大 ， 甚 至 对 同一 系列 的 芯片 变化 也 会 很 大 。 例 如 ，Intel 8088 有 4 个 16 位 通用 
寄存 器 ， 而 7 年 后 设计 的 Intel 80386 则 采用 了 32 位 寄存 器 。 对 寄存 器 高 效 的 利用 是 编写 快速 、 优 
化 的 程序 的 关键 。 遗 憾 的 是 ， 由 于 不 同 计算 机 之 间 存 在 差异 ， 使 得 这 成 为 比较 困难 的 一 个 方面 。 
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程序 计数 器 (PC) 


CC | 


指令 寄存 器 (IR) 


控制 单元 (CU) 算术 和 逻辑 单元 (ALU) 





总 线 
图 1-8 CPU 的 典型 内 部 结构 
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1.2.4 表示 

位 模式 的 解释 是 任意 的 

首先 考虑 一 下 老式 的 8 位 微 计算 机 芯片 中 的 寄存 器 。 它 能 保存 多 少 种 不 同 的 模式 呢 ? 对 这 
个 问题 的 另 一 种 问 靶 是 : 按 正 反面 排列 8 个 便士 硬币 的 序列 有 多 少 种 方式 ， 或 者 ， 分 别 是 0 或 ! 
的 8 个 数字 能 构成 多 少 种 串 。 

对 于 第 一 个 位 /硬币 /数字 有 两 种 可 能 性 ， 对 第 二 个 也 有 两 种 可 能 性 ， 这 样 一 直下 去 直到 我 们 
达到 第 8 位 即 最 后 一 位 数字 。 这 样 就 有 2 . 2 - 2 . 2 . 2 . 2 . 2 . 2 种 可 能 性 ， 算 出 来 就 是 2: = 64 种 
不 同 的 存储 模式 。 类 似 的 推算 显示 出 ， 对 于 32 位 寄存 器 ， 存 在 222 即 刚好 超过 40 亿 .种 存储 模式 。 
(的 确 ， 对 于 过 分 苛刻 的 人 来 说 应 该 是 22 =4 294 967 296。 处 理 大 的 二 进 制 宕 的 一 个 有 用 经 验 是 
2 虽然 真实 值 是 1024， 但 十 分 接近 于 1000。 回 忆 一 下 ， 数 的 相 乘 可 通过 指数 相 加 实现 : an . 
ac=abtc。 这 样 ， 232 就 是 22+10+10+10， 即 22 .20.2.10.2. 10， 也 就 是 大 约 4 . 1000 . 1000 . 1000。) 

但 是 这 些 模式 意味 着 什么 呢 ? 实际 的 答案 是 : 要 由 程序 员 来 决定 它们 意味 什么 。 在 下 一 
个 小 节 你 将 会 看 到 ， 可 以 将 位 模式 00101101 解 释 为 数字 77。 也 有 可 能 解释 成 8 个 不 同 的 是 / 否 
问题 的 答案 。( “你 结婚 了 吗 ? ”一 没有 。 "你 过 了 25 岁 了 吗 ? ”一 没有 。.“ 你 是 男性 吗 ? ”一 是 。 
如 此 等 等 。) 它 也 可 以 表示 键盘 上 所 按 下 的 键 (在 这 种 情况 下 ， 这 个 模式 就 表示 大 写 的 M 的 
ASCII 值 )。 对 位 模式 的 解释 是 任意 的 ， 对 同一 种 模式 ， 计 算 机 可 以 有 很 多 种 使 用 方式 。 程 序 
员 的 一 部 分 任务 就 是 确保 计算 机 总 是 能 正确 地 解释 这 些 任 意 的 、 意 义 含糊 的 模式 。 

自然 数 

解释 位 模式 的 常用 方式 涉及 二 进 制 (binary) 算术 运算 (基数 为 2)。 在 传统 的 十 进 制 
(decimal) 运算 (基数 为 10) 中 ， 只 有 从 0 到 9 这 十 个 不 同 的 数字 符号 。 更 大 的 数 就 表示 为 单 
独 的 数位 乘 以 某 个 基数 值 的 短 。 例 如 ， 数 字 481 就 表示 为 4 102+8 . 101+1。 采用 这 种 表示 法 ， 
我 们 只 用 三 位 十 进 制 数字 就 能 表示 999 以 内 的 所 有 自然 数 。 采 用 类 似 的 表示 法 ， 但 用 2 的 寡 累 
加 ， 我 们 就 能 用 0 和 1 表示 任何 二 进 制 数 。 

以 十 进 制 数 85 作 为 例子 ， 通 过 简单 的 运算 显示 出 该 数 等 于 64+ 16+4+1， 更 详细 地 写成 1 
25+0 . 25+1. 2440. 23+1. 22+0. 21+1。 采 用 二 进 制 ， 这 个 数 就 写成 1010101。 用 8 位 寄存 器 ， 
这 个 数 可 存储 为 01010101， 而 用 32 位 寄存 器 ， 将 成 为 000000000 000000000 0000000 1010 101。 

可 以 在 这 些 二 进 制 数 上 进行 算术 运算 ， 所 采用 的 策略 和 算法 与 小 学 生 解 决 10 进 制 问 题 一 
样 。 事 实 上 ， 二 进 制 运算 其 至 更 容易 ， 因 为 加 法 和 乘法 表 更 小 而 且 简 单 得 多 ! 因为 只 有 0 和 1 
两 个 数字 ， 所 以 表 中 只 有 四 项 ， 如 图 1-9 所 示 。 只 要 记 住 ， 当 进行 二 进 制 加 法 (基数 为 2) 时 ， 
只 要 得 到 结果 2 就 产生 一 个 进位 (就 像 在 十 进 制 


十 |0 1 0 1 
中 每 次 得 到 结果 10 就 产生 一 个 进位 一 样 ) 这 样 ， jo 一 olo 6 
在 基数 为 2 时 ，1 + 1 的 结果 不 是 2， 而 是 0 并 有 进 1|1 10 1|0 1 
位 1， 也 就 是 10。 


对 这 些 表 进 行 观察 ， 可 以 发 现 二 进 制 运算 图 1-9 二 进 制 (基数 为 2) 运算 的 加 法 和 乘法 表 
和 布尔 代数 之 间 的 本 质 联系 。 乘 法 表 与 AND 是 一 样 的 。 当 然 加 法 可 能 产生 两 个 数 : 和 与 〈 可 
能 的 ) 进位 。 进 位 存在 的 充分 必要 条 件 是 第 一 个 数字 和 第 二 个 数字 均 是 1。 换 名 话说 ， 进 位 也 
就 是 两 个 加 数 的 AND ， 而 和 (不 包括 进位 ) 是 1 的 条 件 是 第 一 个 数字 是 1 或 者 第 二 个 数字 是 1， 
但 不 能 都 是 1， 也 就 是 两 个 加 数 的 XOR 。 通 过 建立 适当 的 AND 和 XOR 门 ， 计 算 机 就 能 在 寄存 
器 的 表示 能 力 范 围 内 对 任何 数字 进行 加 法 和 乘法 操作 。 

那么 ， 一 个 8 位 害 存 器 能 存储 多 大 的 数字 呢 ? 最 小 的 可 能 值 显然 是 00000000， 代 表 数 字 0。 
最 大 的 可 能 值 就 是 11111111， 代 表 255。 任 何在 这 个 范围 的 整数 都 可 以 容易 地 表示 成 8 位 的 量 。 


多 7 间 于 算 和 表示 1 





对 于 32 位 寄存 器 ， 最 小 的 值 仍然 是 0, 但 最 大 的 值 刚好 超过 42 亿 。 

虽然 计算 机 解释 长 的 二 进 制 数 没有 困难 ， 但 对 人 类 来 说 往往 有 困难 。 例 如 ，32 位 数字 
00010000000000000000100000000000 与 数字 (做 一 下 深呼吸 ) 0001 0000 00000 
0000001000000000000 是 一 样 的 吗 ? (不 ， 它 们 是 不 同 的 。 第 一 个 数 的 两 个 1 之 间 有 16 个 0， 
而 第 二 个 数 的 两 个 1 之 闻 有 15 个 0。) 因为 这 个 原因 ， 当 有 必要 处 理 二 进 制 数字 时 (希望 这 种 情 
况 很 少 )， 多 数 程序 员 宁 愿 使 用 十 六 进 制 (hexadecimal) (基数 为 16) 数字 来 代替 。 由 于 16= 
2， 每 个 4 位 的 块 《有 时 称 为 半 字 节 (nybble)) 可 表示 成 一 个 基数 为 16 的 “数字 ”。 在 16 个 十 
六 进 制 数 字 中 ， 我 们 熟悉 其 中 0 到 9 这 10 个 数字 ， 表 示 0000 到 1001 等 模式 。 由 于 我 们 日 常 的 十 
进 制 数 只 使 用 10 个 数字 ， 计 算 机 科学 家 就 增 选 字母 A 到 F 来 代表 其 余 的 模式 (1010，1011， 
1100，1101，1110，1111， 全 部 的 转换 列表 见 表 1-1)。 目 前 ， 这 几乎 是 人 们 对 十 六 进 制 数 的 
唯一 使 用 方式 ， 用 于 指定 和 简写 (比如 密码 学 或 网 络 中 可 能 用 到 的 ) 长 的 位 串 值 。 上 面 两 个 
数 转换 成 基数 为 16 时 明显 有 所 不 同 : 


0001 0000 0000 0000 0000 1000 0000 0000 





1 0 0 0 0 8 0 0 = Ox10000800 
0001 0000 0000 0000 0001 0000 0000 0000 
1 0 0 0 1 0 0 0 = 0x10001000 
表 1-1 十 六 进 制 <> 二 进 制 数 字 的 转换 
十 六 进 制 二 进 制 十 六 进 制 二 进 制 十 六 进 制 二 进 制 十 六 进 制 ” ”二进制 

0 0000 4 0100 8 1000 C 1100 
1 0001 5 0101 9 1001 D 1101 
2 0010 6 0110 A 1010 E 1110 
3 0011 7 0111 B 1011 F 1111 


根据 很 多 计算 机 语言 (包括 Java、C、 及 C++) 的 惯例 ， 写 十 六 进 制 数 时 用 “0x” 或 “0X” 
开头 。 我 们 在 这 里 遵循 这 个 惯例 ， 这 样 数字 1001 就 是 指 十 进 制 数 1001。 值 0x1001 就 是 指 163 十 
1 ， 就 是 十 进 制 值 4097。 (本 书 中 的 那些 二 进 制 量 很 好 辨别 。 另 外 ， 在 很 少 的 情况 下 ， 一 些 模 
式 写 成 8 进 制 (octal) 数字 ， 即 基数 为 8。 在 C、C++、 或 Java 中 ， 这 些 数字 用 0 开头 ， 数 字 
01001 作 为 八进制 数 就 等 价 于 $13。 这 是 一 个 不 太 走 运 的 惯例 ， 因 为 几乎 没 人 出 于 某 种 理由 使 
用 八进制 ， 但 传统 如 此 。) 注意 不 论 基 数 是 什么 ，0 还 是 0 (1 也 还 是 1) 。 

基数 转换 

从 一 种 基数 表示 转换 到 另 一 种 表示 可 能 很 乏味 但 却 是 必要 的 事情 。 幸 运 的 是 ， 所 涉及 的 
数学 知识 相当 简单 。 例 如 ， 如 果 你 理解 了 表示 方法 ， 从 其 他 任何 进 制 转换 到 十 进 制 就 很 简单 。 
例如 ， 二 进 制 数 110110 就 表示 25+ 24 二 22 十 21， 就 是 32+16+4+2， 得 S54。 类 似 地 ，0x481 就 
是 4. 162+8 . 16!+1， 就 是 1024+128+1， 即 十 进 制 数 1153。 

完成 计算 的 一 种 更 简单 的 方式 是 交替 进行 乘法 和 加 法 。 二 进 制 数 110110 显 然 是 二 进 制 值 
11011 的 2 倍 。( 如 果 不 是 显然 的 ， 就 注意 一 下 十 进 制 数 53280 是 值 528 的 10 倍 ) 。 接 下 来 二 进 制 数 
11011 又 是 1101 的 2 倍 再 加 1。 这 样 ， 简 单 地 交替 乘 以 基数 值 和 加 1 就 行 了 。 采 用 这 种 方法 ， 二 
进 制 110110 就 成 为 ; 

(((((((((1 72) 十 上 2) 十 0 2)+1) 2)+1) :2)+0) 
简单 计算 证 实 得 数 是 54。 类 似 地 ，0x481 是 : 
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， ((((4. 16)+8) . 16)+1) 
可 求 得 值 为 1153。 
如 果 交 替 进 行 乘法 和 加 法 就 能 转换 为 十 进 制 数 ， 顺 理 成 章 地 ， 交 替 进 行 除法 和 减法 就 能 
将 十 进 制 数 转换 到 二 进 制 数 。 在 我 们 进行 除法 操作 时 ， 减 法 实际 上 是 隐 含 的 。 当 一 个 整数 除 
以 另 一 个 整数 时 ， 很 少 得 到 除 尽 的 答案 。 一 般 会 有 一 个 余数 ， 这 个 余数 必须 隐 含 地 从 被 除数 
中 减 去 。 这 些 余数 就 是 得 数 。 再 以 54 为 例 ， 我 们 重复 地 除 以 2 就 产生 所 需要 的 二 进 制 数 字 : 
54 二 2= 二 27 余 0 
27 二 2== 13 余 1 
13 二 2=6 余 1 
6 二 2 二 3 余 0 
3 二 2=1 余 1 
1 二 2=0 余 1 


黑体 数字 当然 就 是 54 相应 二 进 制 数 各 位 上 的 数 (二 进 制 数 110110)。 仅 有 的 球 手 事情 就 是 
要 记 住 ， 在 乘法 进行 过 程 中 ， 数 字 是 按 正常 顺序 (从 左 到 右 ) 进入 的 ， 所 以 并 不 奇怪 ， 在 除 
法 过 程 中 ,数字 是 按 反 向 从 右 到 左 的 顺序 出 来 的 。 这 个 过 程 对 基数 为 16 (或 者 基数 为 8， 基 数 
为 4， 或 者 任意 基数 ) 也 适用 : 
115$3 二 16=72 余 1 
72 二 16=4 余 8 
4 二 16=0 余 4 


最 后 ， 最 常用 同时 也 许 是 最 重要 的 转换 是 直接 〈 并 且 快速 地 ) 在 二 进 制 和 十 六 进 制 之 间 
进行 转换 ， 不 管 按 哪 个 方向 。 幸 运 的 是 ， 这 也 是 最 容易 的 。 因 为 16 是 2 的 4 次 宕 ， 乘 以 16 实 际 
上 就 是 乘 以 2。 这 样 ， 每 个 十 六 进 制 数字 就 直接 对 应 一 组 4 位 二 进 制 数字 。 就 像 较 早 讨论 过 的 ， 
要 从 十 六 进 制 转换 到 二 进 制 ， 只 要 简单 地 将 每 个 数字 替换 成 等 价 的 4 位 二 进 制 数字 即 可 。 要 从 
二 进 制 转换 到 十 六 进 制 (hex) ， 就 要 将 二 进 制 分 裂 成 4 位 的 若干 个 组 〈 从 右边 开始 ) ， 并 按 反 
方向 完成 替换 操作 。 全 部 的 转换 如 表 1-2 所 示 。 


表 1-2 十 六 进 制 <> 二 进 制 数字 转换 ( 表 1-1 的 拷贝 ) 


十 六 进 制 二 进 制 十 六 进 制 二 进 制 十 六 进 制 二 进 制 十 六 进 制 。 ”二进制 
0 0000 4 0100 8 1000 C 1100 
1 0001 5 0101 9 1001 D 1101 
2 0010 6 0110 A 1010 E 1110 
3 0011 7 0111 B 1011 F 1111 


这 样 ， 二 进 制 数 100101101100101 就 分 解 成 4 位 一 组 的 半 字 节 ， 从 右 开 始 ， 就 是 100 1011 
0110 0101。( 请 注意 我 偷懒 了 ， 我 给 你 的 数 只 有 15 位 ， 所 以 有 一 个 4 位 组 是 不 金 的 。 这 个 组 总 
是 在 最 左 端 ， 要 用 0 来 填补 ， 所 以 你 需要 转换 的 真正 值 是 0100 1011 0110 0101。) 如 果 在 表 中 
查 这 四 个 值 ， 你 会 发 现 它们 对 应 于 4、B、6 及 5。 因 此 ， 相 应 的 十 六 进 制 数 就 是 0x4B65。 

从 相反 方向 ， 十 六 进 制 数 0x18C3 可 转化 为 四 个 二 进 制 数组 0001 (1)、1000 (8)、1100 
(C) 及 0011 (3) ， 放 在 一 起 就 得 出 0001100011000011 。 

类 似 的 技术 也 适用 于 八进制 (基数 8) ， 对 应 于 表 1-1 的 前 两 列 并 只 使 用 最 后 3 个 (而 不 是 4 
个 ) 数字 ， 如 表 1-3 所 示 。 采 用 这 些 表示 方法 和 技术 ， 你 就 能 在 一 个 足够 大 的 寄存 器 中 表示 任 
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何 非 负 的 整数 ， 并 用 我 们 讨论 过 的 任何 基数 来 解释 。 发 挥 一 点 创造 性 和 才能 ， 你 甚至 能 使 这 
些 技术 运用 于 象 3 或 7 这 样 怪 异 的 基数 。 


表 1-3 八进制 -= 二进制 数 转换 





八进制 二 进 制 八进制 二 进 制 
0 000 4 100 
1 001 5 101 
2 010 6 110 
3 011 7 111 
带 符号 表示 


在 真实 世界 中 ， 常 常 使 用 负数 。 如 果 存 储 在 寄存 器 中 的 最 小 可 能 值 是 0， 那 么 ， 计 算 机 如 
何 存储 负数 值 呢 ? 这 个 相当 奇怪 的 问题 不 是 存储 的 问题 而 是 解释 的 问题 。 虽 然 对 于 给 定 的 寄 
存 器 大 小 可 存储 的 最 大 模式 数 是 固定 的 ， 但 程序 员 可 以 将 一 些 模式 解释 为 负数 值 。 通 常 的 方 
法 是 采用 一 种 称 为 二 进 制 补 码 表 示 (two's complement notation) 的 解释 方式 。 

通常 人 们 认为 ， 如 果 你 倒车 〈 甚 至 电影 《春天 不 是 读书 天 》 (Ferris Beuller’ Day off) 中 
也 这 么 认为 ) ， 里 程 表 会 反 转 而 且 显 然 会 让 发 动机 取消 几 英里 。 我 不 知道 是 否 会 这 样 ， 对 Ferris 
并 非 如 此 ， 但 Howstuffworks.come 说 应 Coooo 
该 这 样 。 暂 时 想象 会 这 样 。 假 设 我 取 来 
一 辆 相对 较 新 的 车 (比方 说 ， 有 了 10 英 
里 的 里 程 )， 并 将 其 倒退 行驶 11 英 里 。 里 
程 表 会 显示 什么 呢 ? 

可 是 ,里 程 表 不 会 显示 是 “一 1 英里 ”。 
超过 000, 000 后 ， 它 可 能 会 显示 999, 999 
英里 。 但 是 ， 如 果 我 再 向 前 行驶 1 英里 ， 
里 程 表 就 又 会 转 到 000, 000。 我 们 可 以 
隐 含 地 将 一 1 定义 为 这 样 一 个 数字 ， 当 1 
加 上 它 时 ， 结 果 为 0。 

这 就 是 二 进 制 补 码 表示 法 的 原理 。 
负数 是 从 全 0 的 寄存 器 开始 通过 向 反方 
向 计数 〈 采 用 二 进 制 ) 来 产生 和 处 理 的 ， 1000 
如 图 1-10 所 示 。 首 位 是 0 的 数 被 解释 为 图 1-10 4 位 带 符号 整数 表示 的 结构 
. 正 数 〈 或 0) ， 而 首位 是 1 的 数 被 解释 为 
负数 。 例 如 ， 数 13 写 成 8 位 二 进 制 数 为 00001101 (是 十 六 进 制 数 0x0D)， 而 数 一 13 是 11110011 
(0xF3)。 这 些 模式 称 为 带 符号 (signed) 数 ， 以 区 别 于 先前 定义 的 无 符号 (unsigned) 数 。 特 
别 是 ， 模 式 0xF3 是 一 13 的 二 进 制 补 码 表示 (在 8 位 寄存 器 中 )。 

我 们 如 何 才 能 从 0xF3 得 到 一 13 呢 ?除了 1 打头 ， 显然 两 种 表示 之 间 不 存在 相似 性 。 两 者 之 
间 的 关系 相当 微妙 ， 这 是 建立 在 上 面 所 定义 的 负数 是 正 数 取 反 这 一 基础 上 的 。 就 是 说 ，13 十 
一 13 应 该 为 0。 采 用 上 面 的 二 进 制 表 示 ， 我 们 注意 到 : 





© http:/autohowstuffworks.com/odometerl .thm 。 
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06001161 13 
+ 111106011 -13 用 二 进 制 补 码 表示 
100000000 6 加 上 一 个 溢出 /进位 


然而 ，9 位 的 量 100000000 (0x100) 无 法 存储 在 一 个 8 位 寄存 器 中 ! 就 像 当 英里 里 程 数 变 
得 过 大 时 汽车 里 程 表 超 过 限度 一 样 ，8 位 寄存 器 也 会 溢出 (overflow) 并 丢失 包含 在 第 九 位 的 
信息 。 这 样 就 导致 所 存储 的 模式 是 00000000， 即 0x00， 也 就 是 二 进 制 (十 六 进 制 也 是 ) 0。 采 
用 这 个 方法 ， 我们 就 能 看 到 ， 存 储 在 8 位 寄存 器 中 的 值 的 范围 是 从 一 128 (0x80) 到 二 127 
(0x7F)。 大 概 一 半 值 是 正 数 ， 一 半 值 是 负数 ， 这 就 是 人 们 一 般 所 想 要 的 。 图 1-10 显 示 ， 一 般 
情况 是 ， 负 数 比 正 数 多 一 个 ， 因 为 图 中 0 对 面 的 数 是 负数 。 

这 个 展示 非常 依赖 于 使 用 8 位 寄存 器 。 对 于 一 个 32 位 寄存 器 ， 就 需要 更 大 的 值 来 产生 溢出 
并 循环 回 到 0。 一 13 的 32 位 二 进 制 补 码 表示 不 是 0xF3， 而 是 0xFFFFFFF3。 事 实 上 ，0xF3 若 被 看 
作 是 一 个 32 位 的 数 ， 则 通常 被 解释 成 0x000000F3， 它 甚至 不 是 负数 ， 因 为 它 的 首位 数字 不 是 1。 

手工 计算 一 个 数 的 二 进 制 补 码 表 示 (对 于 固定 的 寄存 器 大 小 ) 并 不 困难 。 首 先 注意 到 ， 
对 于 任何 大 小 的 寄存 器 ， 一 ! 的 表示 都 是 寄存 器 所 有 的 位 均 为 1。 向 这 个 数 加 1 将 产生 溢出 并 使 
寄存 器 的 所 有 位 均 为 0。 对 于 任意 给 定 的 位 模式 ， 如 果 你 对 每 个 位 进行 反 转 (每 个 1 变 成 0， 每 
个 0 变 成 1， 并 保持 原来 的 顺序 。 这 个 操作 有 时 被 称 为 按 位 bitwise) 取 反 (NOT)， 因 为 它 将 
NOT 操 作 施 加 于 每 个 位 ) ， 并 将 得 到 的 数 再 加 上 原来 的 数 ， 得 到 的 结果 就 是 寄存 器 所 有 的 位 均 
为 1。 (为 什么 ? ) 这 个 反 转 的 模式 (有 了 时 称 为 “1 补 码 ” 或 者 称 为 “ 反 码 ”) 加 到 原来 的 模式 ， 
产生 的 和 为 一 1。 当 然 ， 再 加 上 1 就 得 到 一 1+1， 即 90。 这 个 反 转 的 模式 加 1 就 得 到 原 数 的 二 进 
制 补 码 。 


66661161 (= 13) 
11119616 ”( 按 位 取 反 ) 
1 


11110011 (= -13) 


注意 ， 再 重复 这 个 过 程 一 次 就 使 反 转 值 再 反 转 一 次 。 
11110011 (= -13) 
89061106 “( 按 位 取 反 ) 

1 


60001101 (= 13) 


这 个 过 程 可 推广 到 任何 数 和 任何 〈 正 数 ) 寄存 器 大 小 。 减 法 以 同样 方式 进行 ， 因 为 减 去 
一 个 数 就 等 同 于 加 上 这 个 数 的 负数 。 

除了 表示 有 符号 整数 ， 还 常常 要 求 计算 机 表示 小 数 或 者 带 小 数 点 的 量 。 为 做 到 这 一 点 ， 
可 对 标准 的 科学 记 数 法 进行 修改 ， 采 用 基于 2 的 等 代替 基于 10 的 需 。 这 些 数 通常 称 为 浮 点 
(floating point) 数 ， 因 为 根据 这 种 表示 方式 ， 它 们 包含 可 浮动 的 小 数 点 。 

从 基本 的 数 开 始 ， 显 然 任何 整数 都 可 通过 增加 一 个 小 数 点 和 很 多 个 0 的 办 法 转换 为 带 小 数 
点 的 数 。 例 如 ， 整 数 5 就 变 成 5.000...， 整 数 一 22 就 变 成 一 22.0000…， 等 等 。 对 其 他 进 制 数 也 
是 这 样 (只 不 过 从 技术 上 讲 小 数 (decimal) 点 针对 十 进 制 ， 而 对 其 他 基数 则 称 为 小 数 (radix) 
点 )。 这 样 ， 二 进 制 数 1010 转 换 成 小 数 就 是 1010.0000… ， 而 十 六 进 制 数 0x357 转 换 成 小 数 就 是 
0x357.0000…。 
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任何 带 小 数 点 的 数 都 可 通过 移动 小 数 点 并 乘 以 若干 次 基数 而 写成 科学 记 数 的 形式 。 例 如 ， 
阿 伏 加 德 罗 数 通常 近似 为 6.023 . 103。 即 便 是 忘记 了 它 在 化 学 中 的 重要 性 的 学 生 也 应 能 解释 
这 种 表示 。 阿 伏 加 德 罗 数 是 一 个 24 位 (23 +1) 的 数 ， 其 起 始 的 四 位 数字 是 6, 0, 2, 3， 大 约 为 
602 300 000 000 000 000 000 000。 科 学 记 数 法 有 三 个 部 分 ; 基数 (base) (在 本 例 中 是 10)， 
指数 (exponent) (23) 及 尾数 (mantissa) (6.023)。 为 解释 这 个 数 ， 就 要 对 基数 求 指数 次 的 
稳 并 与 尾数 乘 。 显 然 ， 有 很 多 种 不 同 的 尾数 /指数 对 能 产生 相同 的 数 。 阿 伏 加 德 罗 数 也 可 写成 
6023 . 102、60.23 . 102 或 者 甚至 是 0.6023 . 1024。 

计算 机 可 采用 同样 的 思想 ， 但 要 用 二 进 制 表 示 。 特 别 地 要 注意 表 1-4 的 模式 。 一 个 数 乘 以 
2 就 将 其 左 移 1 位 ， 除 以 2 就 将 其 右 移 1 位 。 采 用 科学 记 数 法 形式 也 按 同样 的 位 模式 移动 (指数 
要 适当 调整 ) ， 如 表 1-4 所 示 。 


表 1-4 二进制 数 的 指数 表示 


十 进 制 数 二 进 制 整数 二 进 制 小 数 科学 记 数 法 
5 00000101 00000101.0000.… 1.01(binary) .22 
10 00001010 00001010.0000... 1.01(binary) + 23 
20 00010100 00010100.0000... 1.01(binary) . 24 
40 00101000 00101000.0000... 1.01(binary) . 25 


我 们 将 这 种 方法 进行 扩展 来 表示 二 进 制 的 非 整 数 浮 点 数 ， 如 表 1-5 所 示 。 例 如 ， 数 2.5 是 5 
的 一 半 ， 可 表示 成 二 进 制 量 10.1 或 者 二 进 制 量 1.01 乘 以 2:。 那 么 ，1.25 就 是 二 进 制 1.01 或 者 
1.01 乘 以 22"。 用 这 种 表示 ， 任 何 十 进 制 浮 点 量 都 有 一 个 等 价 的 二 进 制 表 示 。 


表 1-5 ”二进制 小 数 的 指数 表示 


十 进 制 数 二 进 制 数 二 进 制 实数 科学 记 数 法 
5 101 00101.000... 1.0100(binary) + 22 
2.5 00010.100... 1.0100(binary) . 2! 
1.25 00001.010... 1.0100(binary) . 2° 
0.6125 00000.101.. 1.0100(binary) . 271 


电气 和 电子 工程 师 协会 (IEEE) 已 经 发 布 了 一 系列 的 规范 文献 ， 描 述 了 用 二 进 制 表示 浮 
点 数 的 标准 方式 。 其 中 一 个 标准 IEEE 754 一 1985 就 描述 了 将 浮 点 数 存储 成 32 位 字 的 方法 ， 如 
下 所 示 (如 图 1-11 所 示 ): 
符号 指数 尾数 





图 1-11 IEEE 32 位 浮 点 存储 : 符号、 指数、 尾数 


对 字 的 32 位 编号 ， 最 左 端 为 第 31 位 ， 最 右 端 是 第 0 位 。 首 位 〈 第 31 位 ) 是 符号 (sign) 位 ， 
表明 这 个 数 是 正 数 还 是 负数 。 与 二 进 制 补 码 的 表示 不 同 ， 这 个 符号 位 是 能 显示 量 值 相同 的 两 
个 不 同 数 的 唯一 方式 。 

再 往 后 的 8 个 位 (第 30 一 23 位 ) 是 “ 偏 置 的 ”指数 (exponent)。 要 是 用 位 模式 00000000 
来 代表 2， 用 位 模式 00000001 来 代表 2! 是 可 以 的 ， 但是， 那样 的 话 我 们 就 不 能 表示 象 0.125 (2-3) 
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这 样 的 小 数值 。 用 8 位 二 进 制 补 码 表示 也 是 有 意义 的 ， 但 IEEE 也 没有 这 样 选择 。 IEEE 选 择 的 
是 采用 无 符号 数 0..255， 但 存储 在 指数 位 (表现 指数 ) 的 数 是 一 个 “ 偏 置 的 ”指数 ， 实 际 值 
比 “真实 ”指数 大 127。 换 句 话 说， 一 个 实际 为 0 的 指数 被 存储 为 表现 指数 127 (二 进 制 
01111111)。 一 个 实际 为 1 的 指数 将 被 存储 为 表现 指数 128 (二 进 制 10000000)， 而 存储 成 
00000000 的 指数 实际 代表 的 是 很 小 的 量 2-127。 其 余 的 23 位 (第 22 一 0 位 ) 是 带 小 数 点 
(decimal point) (技术 上 称 为 小 数 点 (radix point) ， 因 为 我 们 再 也 不 用 处 理 十 进 制 了 ) 的 尾数 ， 
传统 上 被 放置 在 紧 跟 第 一 位 二 进 制 数 的 后 面 。 这 个 格式 在 小 数 点 前 面 有 固定 位 数 ， 有 时 称 为 
范式 (normalized form ) 。 
这 样 ， 对 于 常规 的 数 ， 存 储 在 寄存 器 中 的 值 就 是 ， 


(一 1) 答 号 位 .尾数 .2 真实 指数 + 127 


表现 指数 为 127 就 意味 着 尾数 乘 以 1 (相应 的 真实 指数 是 0。 所 以 科 数 是 2 )， 而 表现 指数 
为 126 就 意味 着 小 数 乘 以 2 ! 即 0.5， 依 此 类 推 。 
实际 上 ， 上 式 中 有 一 个 小 小 的 陷阱 。 因 为 数 是 二 进 制 表示 的 ， 第 1 个 非 夫 数 字 必 须 是 1 
(如 果 不 是 0 没有 其 他 的 选择 ! ) 。 由 于 知道 第 一 位 数字 是 1， 我 们 就 能 将 其 略 去 以 便利 用 节省 
下 来 的 空间 来 存储 我 们 预先 不 知道 的 其 他 数字 。 所 以 ， 真 实 公式 应 该 是 ，; 
(一 1) 符 呈 位. 1. 尾数 :2 真实 指数 +127 


作为 一 个 简单 的 例子 ,十进制 数 2.0 用 二 进 制 表示 是 1.0 . 21。 将 这 个 数 表示 成 一 个 IEEE 浮 
点 数 ， 符 号 位 是 0 (是 一 个 正 数 )， 尾 数 全 是 0 (还 有 一 个 隐 含 的 首位 1) ， 指 数 是 127 二 1， 即 
128， 也 就 是 二 进 制 数 10000000。 这 将 会 以 32 位 的 量 存储 。 

0 10000000 00000000000000000000000 

符号 指数 

这 个 位 模式 可 写成 十 六 进 制 数 0x40000000。 

另 一 方面 ; 数 - 1.0 的 符号 位 为 1， 指 数 为 127+0， 即 二 进 制 数 01111111， 尾 数 全 是 0 (加 
上 一 个 隐 含 的 首位 1) 。 这 将 产生 下 面 的 32 位 量 : 

1 01111111 090600000000000000000000 

符号 指数 尾数 

这 个 位 模式 的 另 一 种 写法 是 0xBF800000。 

这 里 还 有 个 小 问题 。 如 果 要 存储 的 数 就 是 0.000.… 你 会 怎么 办 ?在 一 串 0 中 没有 任何 地 方 放 
置 “ 隐 含 的 首位 1"。 作 为 一 个 特殊 情况 ，IEEE 定 义 所 有 位 全 是 0 (符号 、 指 数 、 尾 数 ) 的 位 模 
式 表示 数 0.0。 还 有 一 些 其 他 的 特殊 情况 ， 包 括 正 和 负 的 无 穷 大 ， 还 有 所 谓 的 NaN (不 是 一 个 
数 ， 这 是 当 你 试图 做 一 个 非法 操作 如 对 负数 求 对 数值 时 所 产生 的 结果 ) ， 以 及 用 来 以 极 大 的 精 
确 度 表 示 极 小 数 〈 但 很 少 使 用 ) 的 “ 非 规 范 化 数 ”。IEEE 还 为 在 64 位 和 更 大 的 寄存 器 中 更 准确 
地 存储 数 定义 了 标准 方法 。 对 于 上 面 描述 的 32 位 标准 ， 这 些 额外 的 情况 尽管 在 细节 上 不 同 ， 
在 本 质 上 是 类 似 的 。 但 细节 相当 枯燥 和 技术 化 ， 不 要 求 一 般 程 序 员 掌 握 。 

在 任何 基于 基数 的 表示 中 都 会 出 现 一 个 问题 ， 会 有 一 些 不 能 准确 表示 的 数 。 即 使 不 用 担 
心 无 理 数 (如 rr) ， 一 些 分 数 也 不 能 准确 表示 。 例 如 ， 在 基数 为 10 时 ， 分 数 1/7 有 近似 值 
0.14285714285714... 但 永远 不 会 结束 。 分 数 113 也 类 似 ， 它 的 值 为 0.33333...。 在 基数 为 2 时 ,分 
数 1/3 是 0.010101010101010101... 但 无 法 将 一 个 无 穷 的 序列 放 人 到 23 个 尾数 位 中 。 所 以 ， 解 决 
方法 就 是 : 我 们 不 这 样 做 。 

我 们 采取 的 方法 是 尽 可 能 地 接近 原来 的 值 。 转 换 成 小 数 后 ， 我 们 看 到 1/3 大 概 等 于 
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1.01010101010101010101010 . 2-， 表 示 成 ， 

1 01111101 01010101010101010101010 

号 

这 不 是 一 个 完美 的 表示 ， 但 它 是 接近 的 。“ 接 近 ” 可 能 并 非 在 所 有 情况 下 都 足够 好 。 小 的 
误差 〈 称 为 含 人 误差 (roundoff error) ) 将 不 可 避免 地 进入 到 涉及 浮 点 数 的 计算 中 。 如 果 将 这 
个 数 乘 以 3 (1.1 . 21) ,不 太 可 能 得 到 准确 的 1.0 这 个 值 。 程 序 员 们 ， 尤 其 是 那些 处 理 矩 阵 求 逆 
之 类 大 数值 计算 的 程序 员 们 ， 要 花费 很 多 时 间 来 努力 使 这 种 误差 最 小 化 。 现 在 ， 我 们 能 做 的 
就 是 要 知道 有 这 个 问题 。 

对 浮 点 数 执行 操作 是 棘手 的 (而且 常常 很 慢 )。 直 观 上 看 ， 所 采用 的 算 匠 是 可 以 理解 的 ， 
并 且 非 常 类 似 于 你 已 知道 的 科学 计数 法 表示 的 数 的 操作 。 乘 法 相对 容易 ， 因 为 我 们 知道 2 乘 
以 2 就 是 277。 因 此 ， 对 两 个 浮 点 数 求 乘积 ， 结 果 的 符号 位 就 是 两 个 数 的 符号 位 的 积 或 者 异 或 
(XOR)， 尾 数 就 是 两 个 数 的 尾数 的 乘积 ， 而 指数 就 是 两 个 数 指数 的 和 9。 。 这 样 ， 我 们 就 有 下 
面 的 例子 : 

3.0 = (0) (10000000) (100000000000000000000000) [0x40400000] 

2.5 = (0) (10000000) (010000000000000000000000) [0x40200000] 


3.0. 2.5 的 结果 的 符号 位 就 是 9， 尾 数 就 是 1.100.... 1.010...， 即 1.111... (你 明白 为 什么 
吗 ? )。 最 后 ， 指 数 就 是 1+ 1 二 2， 表 示 成 1000001。 这 样 ， 乘 积 就 是 : 

(9) (10000001) (1110600000000000000000000) [0x40F00000] 

正如 所 预期 的 ， 这 个 数 转 换 后 就 是 7.5。 

加 法 要 困难 得 多 ， 因 为 只 有 两 个 数 的 指数 相同 时 加 法 才能 进行 。 如 果 两 个 相 加 的 数 的 指 - 
数 相 同 ， 则 将 其 尾数 相 加 就 (几乎 ) 足够 了 : 

3.0 = (0) (10000000) (100000000000000000000000) [0x46400000] 

2.5 = (0) (10000000) (010000000000000000000000) [0x40200000] 


二 进 制 数 1.01 加 上 1.1 得 10.11， 所 以 答案 就 是 10.11 乘 以 共同 的 指数 部 分 : 10.11 . 22。 得 到 
的 结果 是 : 

(0) (10000001) (011000000000000000000000) [0x40B00000] 

转换 后 ， 正 如 预期 ， 得 到 结果 5.5。 

然而 ， 当 两 个 指数 不 相同 时 (例如 ， 当 将 2.5 和 7.5 相 加 时 )， 就 要 将 一 个 加 数 转换 成 与 另 
一 个 加 数 的 指数 相同 的 等 价 形式 : 

2.5 = (0) (10000000) (010000000000000000000000) [0x40200000] 

7.5 = (0) (10000001) (111000000000000000000000) [6x40F00000] 

下 面 来 转换 7.5，1.111 . 22 与 11.11 . 21! 等 价 。11.11+1.01 得 101.00。101.00 . 21 等 价 于 

01 . 23。 最 终结 果 就 是 : 

(0) (10000010) (010000000000000000000000) [0x41200000] 

也 正如 所 预期 的 ， 这 个 值 是 10.0。 

字符 表示 

非 数 值 数据 如 字符 和 字符 串 也 按 二 进 制 数 来 处 理 ， 只 是 程序 员 / 用 户 对 它们 的 解释 不 同 。 
存储 字符 最 常用 的 标准 是 ASCII 码 ， 字 面 意 思 是 美国 信息 交换 标准 码 (American Standard 


日 但 记 住 ， 要 考虑 到 指数 的 偏差 以 及 尾数 头 部 上 没有 表示 出 来 的 那个 1。 
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Code for Information Interchange)。ASCII 码 将 特定 字符 分 配 到 0 到 127 之 间 的 各 个 数 。 

这 有 点 过 于 简化 了 。 从 技术 上 说 ，ASCII 码 为 0000000 到 1111111 之 间 (包括 这 两 个 数 ) 的 
每 个 7 位 二 进 制 模式 提供 了 一 个 解释 。 其 中 的 很 多 模式 被 解释 成 字符 。 例 如 ， 模 式 1000001 是 
一 个 大 写 的 “A " 。 一 些 二 进 制 串 ， 尤 其 是 0000000 到 0011111 之 间 的 那些 串 被 解释 成 “控制 字 
符 "， 如 回 车 ， 或 者 到 外 设 的 命令 如 “标题 开始 ”或 “传输 结束 "。 由 于 几乎 所 有 的 计算 机 都 
是 面向 字 节 的 ， 所 以 多 数 计 算 机 不 是 将 ASCIH 字 符 存 储 成 7 位 的 模式 ， 而 是 存储 成 8 位 的 模式 ， 
首位 是 1。 例 如 ， 字 母 A 就 是 二 进 制 01000001， 也 就 是 十 六 进 制 0x41 ， 或 者 说 是 十 进 制 65。 采 
用 8 位 存储 就 使 得 计算 机 能 利用 额外 的 《高 位 ) 模式 进行 字符 集 扩 展 。 例 如 ， 在 微软 的 
Windows 中 ， 几 平 每 个 字符 集 都 有 128 一 255 范 围 内 的 不 同 显示 值 。 这 些 显 示 值 可 能 包括 图 形 
字符 、 扑 克 牌 花色 、 带 区 分 标记 的 外 文字 符 ， 等 等 。 

ASCII 编 码 的 主要 优势 是 每 个 字符 都 很 宽裕 地 对 应 一 个 字 节 。ASCI 的 主要 缺点 是 : 由 于 
它 是 美国 的 标准 码 ， 所 以 不 能 很 好 地 反映 世界 范围 内 字母 表 和 字母 的 变化 。 随 着 因特网 不 断 
地 将 不 同 国家 和 讲 不 同 语言 的 人 们 连接 在 一 起 ， 显 然 就 需要 有 对 非 英 语 (或 者 说 ， 非 美国 ) 
字符 的 编码 方法 。 这 就 出 现 了 Unicode 共 同体 发 布 的 UTF-16 编 码 。 

UTF-16 采 用 两 个 字 节 (16 位 ) 来 存储 每 个 字符 。 前 128 个 模式 几乎 与 ASCII 码 一 样 。 然 而 ， 
由 于 有 16 位 ， 就 有 超过 65 000 (在 技术 上 是 65 536) 个 不 同 的 模式 ， 每 个 模式 可 分 配 一 个 单独 
的 (可 打印 ) 字符 。 这 个 巨大 的 字符 集合 就 使 得 对 用 多 种 字母 表 写 成 的 文档 进行 统一 、 可 移 
植 的 方式 处 理 成 为 可 能 ， 这 些 字母 表 包 括 : (美国 ) 英语 ， 不 常见 的 字符 如 音标 (如 2) 和 货 
币 符号 ， 拉 丁字 母 表 的 变型 如 法 语 和 德语 ， 以 及 (从 美国 计算 机 科学 家 的 角度 看 ) 不 常见 的 
字母 表 如 希腊 语 、 希 伯 来 语 、 西 里 尔 语 (用 于 俄语 )、 泰 语 、 切 罗 基 语 以 及 西藏 语 。 例 如 ， 项 
腊 语 大 写字 母 psi (中 ) 就 是 用 0x803A， 即 二 进 制 数 1000000000111010 来 表示 。 即 使 是 对 汉语 / 
日 语 /朝鲜 语 这 样 的 象形 文字 集合 (包含 的 字符 超过 40 000 个 ) 也 能 表示 〈 见 图 1-12 的 例子 ) 。 

机 器 操作 表示 

除了 存储 很 多 不 同类 型 的 数据 ， 计 算 机 还 需要 存储 可 执行 的 程序 代码 。 如 同 我 们 讨论 过 
的 所 有 其 他 模式 一 样 ， 在 最 基本 的 级 别 上 ， 计 算 机 只 能 解释 二 进 制 的 活动 模式 。 这 些 模式 通 
常 称 为 机 器 语言 (machine language) 指令 。 寄 存 器 在 CPU 中 的 主要 角色 之 一 就 是 取出 并 保存 
一 个 位 模式 ， 这 个 位 模式 可 被 译 码 成 为 机 器 指令 然后 执行 。 

机 器 语言 的 解释 一 般 是 困难 的 并 且 在 计算 机 之 间 变化 极 大 。 对 于 任意 给 定 的 计算 机 ， 指 
令 集 (instruction set) 定义 了 计算 机 能 执行 哪些 操作 。 例 如 ，Java 虚 拟 机 (JVM) 有 一 个 相对 
小 的 指令 集 ， 只 有 256 种 可 能 的 操作 。 每 个 字 节 就 可 解释 成 要 采取 的 可 能 动作 。 值 89 (0x89) 
对 应 于 dup 指 令 ， 该 指令 导致 计算 机 对 存储 在 CPU 中 的 特定 部 分 信息 进行 复制 。 值 146 (0x92) 
对 应 于 i2c 指 令 ， 该 指令 将 一 个 32 位 的 量 (通常 是 整数 ) 转换 成 一 个 16 位 的 量 (通常 是 一 个 统 
一 编码 的 字符 ) 。 这 些 数字 到 指令 的 对 应 关系 特定 于 JVM， 对 奔腾 4 或 PowerPC 是 不 适用 的 ， 
这 两 种 CPU 有 其 特定 的 指令 集 。 

为 完成 某 个 任务 而 生成 机 器 码 常常 是 极为 费力 的 工作 。 计 算 机 通常 为 该 任务 提供 大 强度 
的 编程 支持 。 程 序 员 通常 用 某 种 人 可 读 的 语言 写 程序 ， 然 后 采用 如 编译 器 这 样 的 程序 将 该 语 
言 转换 成 机 器 码 。 编 译 器 本 质 上 就 是 将 人 可 读 的 语言 转换 成 机 器 语言 的 程序 。 

解释 

根据 我 们 在 前 面部 分 所 学 到 的 知识 , 显然 任何 位 模式 都 几乎 能 以 几 种 不 同 的 方式 进行 解释 。 
一 个 给 定 的 32 位 模式 可 能 是 一 个 浮 点 数 、 两 个 UTP-16 字 符 、 几 条 机 器 指令 、 两 个 16 位 整数 、 
一 个 无 符号 32 位 整数 或 很 多 其 他 可 能 性 〈 见 图 1-12)。 计 算 机 如 何 区 分 两 个 相同 的 位 串 呢 ? 
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0011 1110 | 0010 0000 | 0111 0010 | 0011 0111 


解释 为 
十 六 进 制 数 
带 符号 32 位 整数 
带 符 号 16 位 整数 
带 符号 32 位 浮 点 数 

8 位 字符 : 
16 位 字符 2 
JVM 机 器 指令 istore.3 | Tatore.2 如 
图 1-12 位 模式 的 多 种 解释 


简单 的 答案 是 它 不 能 区 分 ， 这 会 存在 误导 。 较 长 但 更 有 用 的 答案 是 对 位 串 的 区 分 是 由 程 
序 指令 的 上 下 文 来 提供 的 。 我 们 将 在 接 下 来 的 章节 中 讨论 到 ， 多 数 计算 机 (包括 已 讨论 过 的 
主要 计算 机 JVM) 都 有 若干 不 同 种 类 的 指令 做 着 大 致 相同 的 事情 。 例 如 ，JVM 就 有 不 同 的 指 
令 来 完成 32 位 整数 、64 位 整数 、32 位 浮 点 数 、64 位 浮 点 数 的 加 法 操作 。 这 些 指令 隐 含 认为 要 
相 加 的 位 模式 就 是 适当 的 类 型 。 如 果 你 的 程序 装 入 两 个 整数 到 寄存 器 中 ， 然 后 告诉 计算 机 做 
两 个 浮 点 数 的 加 法 操作 ， 计 算 机 就 会 天 真 而 无 辜 地 将 两 个 整数 位 模式 当 作 浮 点 数 处 理 ， 将 它 
们 相 加 ， 得 到 无 意义 而 且 完 全 错误 的 结果 。( 图 1-12 表 明了 这 一 点 ， 因 为 该 模式 中 所 隐 含 的 指 
令 在 类 型 上 是 非法 的 。.) 类 似 地 ， 如 果 你 告诉 一 个 计算 机 将 一 个 浮 点 数 作为 一 个 机 器 代码 来 执 
行 ， 计 算 机 就 会 尽 最 大 能 力 地 来 执行 ， 不 管 这 个 数 对 应 了 多 么 愚 玄 的 指令 。 如 果 你 幸运 的 话 ， 
这 只 不 过 会 使 你 的 程序 崩溃 。 如 果 你 不 走运 ，… 那 么 ， 这 就 是 黑客 侵入 计算 机 的 主要 途径 之 
一 : 通过 使 缓冲 器 溢出 并 用 他 们 自己 的 指令 覆盖 可 执行 代码 。 

某 种 类 型 被 看 作 另 外 不 同 的 类 型 来 使 用 几乎 总 是 会 出 错 。 不 幸 的 是 ， 这 种 错误 计算 机 只 
能 部 分 地 弥补 。 最 终 ， 确 保 数据 正确 存储 和 位 模式 正确 解释 要 由 程序 员 〈 以 及 编译 器 编写 者 ) 
负责 。JVM 的 主要 优势 之 一 就 是 它 能 捕获 这 些 错误 。 


1.3 虚拟 机 








1.3.1 什么 是 虚拟 机 

由 于 指令 集 之 间 的 差异 ， 那 么 ， 就 很 有 可 能 (提醒 : 这 是 一 个 相当 保守 的 说 法 ) 使 得 为 一 
个 特定 的 平台 (CPU 类 型 和 /或 操作 系统 ) 所 写 的 程序 不 能 运行 在 不 同 的 平台 上 。 这 就 是 为 什 
么 软件 发 行商 为 使 用 奔腾 4 CPU 的 Windows 计 算 机 和 使 用 PowerPC CPU 的 Macintosh 计 算 机 卖 出 
不 同 版 本 的 程序 ， 也 就 是 为 什么 很 多 程序 有 “最 低 配 置 ”， 即 某 个 特定 的 计算 机 必须 有 一 定 的 
存储 容量 或 某 种 特别 的 视频 卡 才能 正常 工作 。 在 极端 情况 下 ， 这 就 要 求 计算 机 程序 员 独立 地 从 
头 开 始 写 相关 的 程序 (比如 同一 个 游戏 的 Mac 和 Windows 版 本 ) ， 这 实质 上 是 一 个 使 程序 开发 的 
时 间 、 精 力 以 及 成 本 都 加 倍 的 过 程 。 幸 运 的 是 ， 很 少 需要 如 此 。 多 数 的 编程 是 用 所 谓 的 高 级 语 
言 (high-level language) 如 C、C++、 或 Java 来 完成 的 ， 然 后 人 可 读 的 程序 源码 再 由 另外 一 个 
程序 如 编译 器 转换 成 可 执行 的 机 器 码 。 只 有 少 部 分 的 程序 一 一 如 由 入 式 系统 、 需 要 直接 硬件 访 
问 的 图 形 功能 或 者 控制 非 一 般 外 设 的 设备 驱动 器 ， 才 需要 用 机 器 特定 的 语言 来 编写 。 

Java 的 设计 者 意识 到 了 Web 的 普及 性 以 及 需要 在 任何 地 方 都 能 运行 可 编程 Web 页 面 ， 因 此 
采取 了 不 同 的 途径 。Java 本 身 是 一 个 高 级 语言 。Java 程 序 一 般 编译 成 类 文件 (class file)， 每 
个 文件 对 应 于 程序 或 程序 一 部 分 的 机 器 语言 。 与 从 C、Pascal、 或 C++ 编译 而 成 的 标准 可 执行 
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码 不 同 ， 类 文件 无 需 对 应 于 编写 和 运行 程序 的 实际 机 器 。 类 文件 用 机 器 语言 编写 ， 采 用 Java 
虚拟 机 (Java Virtual Machine, JVM) 的 指令 集 ，JVM 只 作为 一 个 软件 仿真 ， 它 是 一 个 模仿 芯 
片 的 计算 机 程序 。 这 个 “机 器 ”有 正常 物理 计算 机 (如 Intel 奔 腾 4) 典型 的 、 有 时 甚至 更 强大 
的 结构 和 计算 能 力 ， 但 却 没有 物理 芯片 的 很 多 问题 和 局 限 性 。 

JVM 通 常 是 一 个 运行 于 宿主 机 上 的 程序 。 像 任何 其 他 可 执行 程序 一 样 ， 它 采用 本 地 机 器 
的 指令 集运 行 于 物理 芯片 上 。 这 个 程序 有 一 个 特殊 的 用 途 : 其 主要 功能 是 解释 和 执行 用 JVM 
机 器 语言 写 的 类 文件 。 通 过 运行 一 个 特定 的 程序 ， 安 装 在 计算 机 中 的 物理 芯片 就 可 扮 作 JVM 
芯片 ， 因 而 就 能 运行 用 JVM 指 令 集 和 机 器 码 写 成 的 程序 。 

“虚拟 机 ”的 思想 并 非 新 生 事物 。1964 年 ，IBM 开 始 着 手 研发 VM/CMS， 这 是 一 个 面向 
System/360 的 操作 系统 ， 能 为 许多 用 户 同时 提供 分 时 服务 。 为 了 将 计算 机 的 服务 全 部 地 提供 给 
每 个 用 户 ，IBM 的 工程 师 们 决定 建立 一 个 软件 系统 和 用 户 接口 ， 给 用 户 这 样 一 个 感觉 ， 他 或 她 
自己 在 享有 整个 计算 机 的 全 部 服务 。 每 个 人 或 程序 都 能 按 需 支配 整个 虚拟 S/360 而 不 用 担心 该 程 
序 是 否 会 导致 另 一 个 人 的 程序 崩溃 。 这 也 使 得 工程 师 们 能 大 幅度 地 更 新 或 改进 硬件 而 不 用 强迫 
用 户 重新 学 习 或 重 写 程序 。 二 十 多 年 以 后 ，VMVCMS 还 在 大 型 IBM 主 机 上 使 用 ， 运 行为 虚拟 
S/360 而 设计 和 编写 的 程序 ， 运 行 虚拟 S/360 的 硬件 已 经 快 了 几乎 几 百 万 倍 。 其 后 ， 虚 拟 机 和 仿 
真 器 已 经 成 为 很 多 编程 工具 和 语言 (包括 Smalltalk， 一 种 早期 的 面向 对 象 的 语言 ) 的 标准 件 。 


补充 资料 

.NET 框 架 

另 一 个 常用 虚拟 机 的 例子 是 .NET 框 架 ， 由 微软 开发 并 在 2002 年 发 布 。.NET 框 架 是 
Visual Studio 当 前 版 本 的 基础 ， 并 为 很 多 基于 网 络 的 技术 如 ASP.NET、ADO.NET、SOAP 
以 及 .NET Enterprise Servers 提 供 了 一 个 统一 的 编程 模型 。 仿 效 Sun 的 JVM 先 例 ，.NET 引 入 
了 一 个 通用 语言 运行 时 (Common Language Runtime，CLR)， 这 是 一 个 虚拟 机 ， 能 管理 
和 运行 用 车 干 种 语言 开发 的 代码 。 该 虚拟 机 采用 了 虚拟 指令 集 ， 称 为 微软 中 间 语 言 
(Microsoft Intermediate Language, MSIL)， 在 思想 上 非常 类 似 于 JVM 的 字 节 码 。 其 至 CLR 
执行 引 区 的 详细 体系 结构 也 类 似 于 JVM。 例如， 它们 都 是 基于 堆栈 的 体系 结构 ， 并 为 面向 
对 象 的 、 基 于 类 的 环境 提供 指令 集 支 持 。 像 JVM 一 样 ，CLR 的 设计 具有 虚拟 机 的 大 多 数 优 
势 : 抽象 可 移植 的 代码 可 广泛 地 分 布 和 和 运行 而 无 需 牺 牲 本 地 机 器 的 安全 性 。 微 软 还 仿效 
Sun 开 发 和 发 行 了 一 个 巨大 的 预定 义 类 库 ， 为 使 用 .NET 框 架 并 且 不 愿意 从 头 开发 类 的 程序 
员 提 供 支持 。 两 个 系统 的 设计 都 考虑 了 Web 服 务 和 移动 应 用 。 与 JVM 不 同 的 是 ，MSIL 或 
多 或 少 是 从 头 开发 的 ， 以 支持 多 种 编程 语言 ， 包 括 形 、C#、Managed C++ 及 Visual Basic。 
微软 还 建立 了 一 个 标准 的 汇编 器 llasm。 实 际 上 ，CLR 作 为 一 个 计算 环境 没有 JVM 那 样 通 
用 和 广泛 发 布 ， 但 是 软件 市 场 变化 多 端 ， 最 终结 果 尚 无 定论 。 

一 个 可 能 会 有 重要 影响 的 关键 问题 是 微软 提供 多 平台 支持 的 程度 。 在 理论 上 ，MSIL 
与 JVM 一 样 是 与 平台 独立 的 。 但 是 ，.NET 框 架 库 的 相当 大 的 部 分 基于 较 早 的 微软 技术 ， 
不 能 成 功 地 运行 于 Unix 操 作 系 统 上 ， 甚 至 不 能 运行 于 较 旱 的 Windows 系 统 上 (如 
Windows98)。 微 软 支持 非 微软 (或 者 更 早 微软 ) 操作 系统 的 历史 记录 未 能 鼓励 第 三 方 开 
发 者 来 开发 足 平 台 的 MSIL 软 件 。 对 比 之 下 ，Java 已 经 建立 了 一 个 包括 所 有 平台 的 强大 的 
开发 组 ， 依 赖 并 支持 这 种 可 移植 性 。 如 果 微 软 能 继续 履行 其 多 平台 支持 的 承诺 ， 并 开发 
出 足够 的 客户 基础 ，.NET 也 许 能 取代 Java 作 为 开发 和 部 署 可 移植 的 基于 Web 应 用 的 首选 
系统 。 
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1.3.2 可 移植 性 问题 

虚拟 机 (特别 是 JVM) 的 一 个 主要 优势 是 ， 只 要 有 适合 的 解释 器 ， 就 可 在 任何 地 方 运行 。 
与 Mac 程 序 需要 PowerPC G4 芯 片 才能 运行 (也 有 G4 仿 真 器 ， 但 很 难 找到 而 且 很 昂贵 ) 不 同 ， 
JVM 对 于 几乎 所 有 计算 机 和 很 多 种 设备 如 PDA 都 可 用 。 每 个 主要 的 Web 浏 览 器 如 Internet 
Explore、Netscape 或 Konqueror 都 有 一 个 JVM (有 了 时 称 为 “Java 运 行 时 系统 (Java runtime 
system)”， 建 立 该 系统 以 使 Java 程 序 正 确 运行 )。 

进一步 地 ，JVM 能 在 任何 地 方 连续 运行 ， 因 为 程序 本 身受 基础 硬件 变化 的 影响 相对 较 小 。 
一 个 Java 程 序 (或 者 Java 类 文件 )， 除 非 考 虑 速度 ， 它 在 一 个 为 旧式 奔腾 计算 机 所 写 的 Java 仿 
真 器 上 运行 与 在 为 顶端 Power G7 (一 款 新 的 尚未 出 现 的 机 型 ) 所 写 的 Java 仿 真 器 上 运行 会 有 
相同 的 表现 。 如 果 / 当 Motorola 开 发 出 产品 时 ， 几 平一 定 会 有 人 为 它 写 一 个 JVM 客 户 程序 。 


1.3.3 超越 限制 

虚拟 机 〈 特 别 是 JVM) 能 提供 的 另 一 个 优势 是 超越 、 忽 略 或 屏 项 基础 硬件 所 施加 限制 的 
能 力 。JVM 有 虚拟 部 件 ， 对 应 于 上 面 讨论 的 真实 计算 机 的 部 件 ， 但 因为 它 包含 的 只 是 软件 ， 
所 以 制造 成 本 微乎其微 。 因 此 ， 这 些 部 件 的 大 小 和 数量 均 可 按 程序 员 的 需要 设置 。 芯 片上 每 
个 实际 的 寄存 器 都 要 占据 空间 、 消 耗 功 率 ， 并 花费 大 量 的 金钱 ， 因 此 ， 寄 存 器 常常 是 相当 短 
缺 的 。 在 JVM 上 ， 寄 存 器 实际 上 是 免费 的 ， 程 序 员 可 任意 使 用 。 连 接 CPU 到 存储 器 的 系统 总 
线 的 大 小 也 可 按 程序 员 的 需求 设置 。 

历史 上 的 真实 例子 有 助 于 说 明 这 个 道理 。 初 始 的 IBM-PC 是 基于 Intel 8088 世 片 的 。8088 又 
基于 Intel 另 外 一 款 更 早 的 芯片 8086， 两 款 芯 片 在 设计 上 几乎 相同 ， 但 8088 采 用 的 是 8 位 总 线 而 
不 是 8086 的 16 位 总 线 。 这 无 疑 限制 了 8088 的 CPU 和 存储 器 之 间 的 数据 传输 速度 ， 相 对 于 8086 
减 小 了 大 约 50%， 但 IBM 决 定 选 择 8088 从 而 将 制造 成 本 和 售 价 保持 在 低 水 平 。 不 幸 的 是 ， 这 
个 决定 在 接 下 来 的 15 年 左右 的 时 间 限 制 了 PC 的 性 能 ， 因 为 IBM、Intel 和 微软 被 要 求 在 所 谓 的 
Intel 80x86 系 列 的 每 个 后 代 产 品 中 都 保持 向 后 兼容 。 只 有 Windows 的 开发 才 使 微软 最 终 能 充分 
利用 较 低 的 制造 成 本 和 更 宽 的 总 线 。 随 着 多 数 主 要 的 软件 和 硬件 制造 商 竞相 在 它们 的 产品 中 
为 若干 种 不 同 的 芯片 和 芯片 集 提 供 支持 ， 在 高 端 世 片 集中 可 利用 的 某 些 特性 在 低 端 却 不 能 得 
到 ， 类 似 的 问题 还 在 发 生 。 适 当 编 写 的 Java 运 行 时 系统 能 利用 (专门 为 新 的 体系 结构 所 写 的 
JVM 上 ) 可 得 到 的 特性 ， 并 使 其 为 所 有 Java 程 序 或 JVM 类 文件 所 用 。 

与 多 数 实际 的 计算 机 芯片 相 比 ，JVM 的 优势 还 在 于 其 设计 在 本 质 上 更 好 、 更 整洁 。 部 分 
原因 是 它 是 在 1995 年 从 头 开 始 设计 的 ， 而 不 是 通过 继承 若干 代 较 早 版 本 的 工程 折 袁 而 得 到 的 。 
设计 者 不 必 担 心 像 芯片 大 小 、 功 耗 或 成 本 这 样 的 物理 限制 ， 由 此 而 导致 的 简单 性 意味 着 设计 
者 能 够 将 其 注意 力 关 注 于 如 何 生成 在 数学 上 易 处 理 和 优雅 的 设计 ， 并 使 高 层次 特性 的 加 入 成 
为 可 能 。 特 别 是 JVM 还 考虑 到 更 高 程度 的 安全 增强 技术 ， 这 一 点 我 们 将 在 下 面 简单 说 明 ， 并 
在 第 10 章 详细 讨论 。 


1.3.4 易于 升级 

与 升级 硬件 的 困难 性 相 比 ， 虚 拟 机 的 另 一 个 优势 是 易于 升级 或 改变 。 有 大 量 证 据 证 明 ， 
1994 年 发 布 的 一 款 奔腾 芯片 有 一 个 错误 ， 即 奔腾 P54C 的 FPU 不 能 正确 工作 。 不 幸 的 是 ， 纠 正 
这 个 缺陷 要 求 消费 者 将 旧 芯 片 发 回 到 Intel 并 进行 完全 的 物理 替换 。 与 此 形成 对 照 的 是 ，JVM . 
实现 上 的 故障 可 由 程序 员 在 软件 中 修复 ， 甚 至 可 以 由 能 进行 源码 访问 的 第 三 方 通过 正常 渠道 
分 发 ， 包 括 简单 地 在 因特网 上 提供 。 

类 似 地 ， 一 个 新 的 改进 JVM 版 本 ， 或 许 算法 得 到 更 新 或 者 速度 得 到 大 幅度 提高 ， 就 可 像 


22 弟 一 这 分 ”假想 计 灌 机 


任何 其 他 升级 的 程序 (如 视频 卡 驱动 器 或 对 标准 程序 进行 安全 升级 ) 一 样 容易 地 发 布 。 由 于 
JVM 只 是 软件 ， 多 疑 的 用 户 甚至 能 保持 连续 若干 个 版 本 ， 在 新 版 本 有 某 些微 妙 和 未 发 现 的 错 
误 时 ， 她 还 能 返回 到 有 旧版 本 以 使 程序 仍 能 运行 。( 当 然 ， 你 只 在 发 现 该 用 户 是 正确 的 之 前 才 认 
为 她 是 多 疑 的 ， 在 这 之 后 你 会 认识 到 她 只 是 谨慎 和 负责 任 。) 


1.3.5 安全 问题 

虚拟 机 的 最 后 一 个 优点 是 ， 在 基础 硬件 的 协作 下 ， 可 进行 配置 而 运行 在 更 安全 的 环境 下 。 
Java 语 言 和 JVM 的 设计 特别 考虑 了 这 种 对 安全 性 的 增强 。 例 如 ， 多 数 的 Java 程 序 不 需要 访问 宿 
主 计算 机 的 硬盘 ， 若 提供 这 种 访问 ， 尤 其 是 写 硬盘 的 能 力 ， 可 能 会 使 计算 机 面临 计算 机 病毒 
的 感染 、 数 据 失窃 或 者 直接 将 极 重 要 的 文件 删除 或 毁坏 等 危险 。 虚 拟 机 由 于 只 是 软件 ， 故 能 
详 查 磁盘 的 访问 企图 ， 并 实施 比 操作 系统 本 身 所 能 实施 的 更 为 精密 的 安全 策略 。 

JVM 甚 至 走 得 更 远 ， 其 设计 不 仅 为 了 安全 性 也 为 了 某 种 程度 的 可 验证 安全 性 。 程 序 中 的 很 
多 安全 缺陷 是 意外 产生 的 ,比如 , 程序 员 试图 读 一 个 串 却 没 有 确保 已 分 配 足够 的 空间 来 保存 它 ， 
甚至 试图 执行 一 个 非法 的 操作 (或 许 是 将 一 个 数 用 ASCII 串 来 除 ) ， 结 果 就 导致 了 不 可 预测 和 
可 能 有 害 的 结果 。JVM 的 字 节 码 被 设计 成 可 验证 的 ， 这 种 验证 是 通过 采用 计算 机 程序 检验 这 种 
意外 错误 来 实现 的 。 这 不 仅 降低 了 出 现 有 害 安全 缺陷 的 可 能 性 ， 也 改进 了 软件 的 总 体质 量 和 可 
靠 性 。 软 件 错误 毕竟 不 一 定 会 摧毁 系统 和 人 允许 非 授权 访问 。 很 多 错误 会 默默 潜伏 着 〈 几 乎 是 检 
测 不 到 ) ， 然 后 产生 错误 的 应 答 。 在 产生 错误 应 答 之 前 ， 有 时 甚至 是 在 程序 运行 之 前 捕获 这 些 
错误 将 会 大 幅度 地 提高 程序 的 可 靠 性 。JVM 安 全 策略 将 在 第 10 章 进行 广泛 的 讨论 。 


1.3.6 劣势 ~ 

如 果 虚 拟 机 是 这 么 的 神奇 ， 为 什么 它们 没有 更 普及 呢 ? 主 要 的 原因 ， 用 一 句 话说 ， 就 是 
“速度 "” 。 进 行 一 个 特定 的 操作 ， 通 常用 软件 完成 要 比 硬件 完成 少 花费 1000 倍 的 时 间 ， 所 以 用 
Java 在 JVM 上 做 核心 的 计算 〈 和 气 阵 相 乘 、DNA 测 序 等 等 ) 比 用 从 C++ 编译 得 到 的 〈 面 向 特定 
芯片 的 ) 机 器 语言 执行 同样 的 计算 要 慢 得 多 。 

幸运 的 是 ， 实 际 的 差距 看 起 来 没有 近乎 1000 倍 那么 大 ， 主 要 的 原因 是 已 有 一 些 非 常 聪明 
的 JVM 实 现 者 。 一 个 写 得 好 的 JVM 会 尽 可 能 利用 可 得 到 的 硬件 做 尽 可 能 多 的 操作 。 这 样 ， 程 
序 就 会 (例如 ) 利用 本 地 机 器 的 电路 做 加 法 ， 而 不 是 全 部 用 软件 来 模拟 。 编 译 技术 的 进步 已 
使 得 Java 运 行 速度 几 平 与 本 地 编译 的 代码 一 样 快 ， 通 常 在 2 倍 运行 时 间 之 内 ， 有 时 几乎 感觉 不 
出 Java 较 慢 。JavaWorld 在 1998 年 2 月 的 一 项 研究 (“性 能 测试 显示 Java 和 C++ 一 样 快 ") 发 现 : 
对 于 一 组 测试 基准 任务 ， 带 有 高 效 编译 器 的 高 性 能 JVM 所 生成 的 程序 一 般 在 最 差 时 也 仅仅 比 
对 等 的 C++ 程序 运行 得 稍 慢 (大 约 5.6%)， 而 在 多 数 情况 下 已 到 了 度量 的 极限 。 当 然 ， 比 较 计 
算 机 和 语言 的 速度 是 极为 困难 的 过 程 ， 就 像 将 标准 的 苹果 和 桔子 做 比较 一 样 ， 不 同 的 研究 者 
会 发 现 不 同 的 价值 。 

在 某 些 方面 ， 速 度 可 能 不 成 问题 。 对 于 非 大 量 数值 计算 的 大 多 数 用 途 ，Java 或 任何 其 他 
合理 的 语言 已 经 快 得 足够 满足 多 数 人 的 需要 。Java 及 其 扩展 JVM 提 供 了 一 组 强大 的 基本 计算 
程序 ， 包 括 广泛 的 安全 度量 ， 这 些 都 是 在 如 C++ 等 很 多 其 他 语言 中 没有 的 。 没 有 理由 认为 ， 
导致 计算 机 快速 崩溃 与 昌 有 点 慢 但 能 够 运行 完 程序 相 比 会 是 一 个 巨大 的 优势 。 

一 个 更 重大 的 劣势 是 在 程序 员 和 实际 物理 硬件 之 间 插 入 了 JVM 解 释 器 。 对 很 多 要 求 汇编 
语言 编程 (游戏 、 高 速 网 络 接 口 或 配备 的 新 外 设 ) 的 应 用 ， 采 用 汇编 语言 的 关键 原因 是 能 够 
在 很 低 的 层次 上 对 硬件 进行 直接 的 控制 (尤其 对 于 外 设 ) ， 通 常 是 按 位 和 按 线 来 控制 的 。 一 个 
写 得 不 好 的 JVM 阻 碍 了 这 种 直接 控制 。 随 着 对 JVM 的 硅 实 现 的 开发 ， 这 越 来 越 不 成 问题 ， 比 
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如 aJile Systems 的 aJ-100 微 控制 器 或 Zucotto Systems 的 Xpresso 系 列 的 处 理 器 。 两 个 公司 都 在 生 
产 适合 于 手持 的 因特网 设备 的 控制 器 芯片 ， 并 将 基于 芯片 的 JVM 字 节 码 的 实现 作为 机 器 码 。 
换 名 话说， 这 些 芯 片 不 要 求 任何 软件 支持 来 将 JVM 字 节 码 转换 为 本 地 指令 集 ， 因 此 能 以 多 硬 
件 速度 运行 ， 并 在 位 的 层次 上 对 硬件 实施 全 面 的 控制 。 随 着 Java 芯 片 的 开发 ，JVM 已 经 完成 
了 一 个 全 面 的 转变 ， 这 个 转变 是 从 允许 对 各 种 不 同 处 理 器 进行 可 移植 和 安全 访问 的 精巧 的 数 
学 抽象 开始 ， 到 其 自身 发 展 成 为 物理 芯片 。 


1.4 JVM 编 程 


1.4.1 Java，JVM 不 是 什么 

必须 强调 ， Java 不 等 同 于 Java 虚 拟 机 ， 虽 然 它 们 是 一 起 被 设计 出 来 的 ， 并 且 常 常 一 起 使 
用 。Java 编 程 语言 是 一 种 高 级 编程 语言 ， 它 设计 成 可 支持 在 诸如 因特网 的 分 布 式 网 络 环境 中 
的 安全 且 平 台 无 关 的 应 用 。 也 许 Java 最 常见 的 使 用 方式 是 创建 “applets”， 作 为 网 页 的 一 部 分 
下 载 并 与 训 览 器 交互 作用 而 无 须 占用 服务 器 的 网 络 连接 。 与 此 不 同 ，Java 虚 拟 机 是 一 个 共享 
的 虚拟 计算 机 ， 它 为 Java 应 用 的 运行 提供 了 基础 。 

Java 设 计 的 很 多 方面 强烈 地 影响 了 JVM。 例 如 ，JVM 是 一 个 虚拟 机 恰 是 因为 Java 应 该 是 一 
个 平台 无 关 的 语言 ， 所 以 它 不 能 对 观察 者 使 用 什么 类 型 的 计算 机 作出 任何 假设 ( 见 图 1-13 ) 。 
JVM 是 围绕 安全 验证 器 的 观念 设计 的 ， 所 以 Java 程 序 能 运行 在 安全 环境 中 。 网 络 支 持 是 在 相 
对 较 低 的 层次 上 建立 在 JVM 标 准 库 中 ， 以 确保 Java 程 序 能 够 使 用 一 个 标准 化 的 、 有 用 的 网 络 
操作 集 。 然 而 ， 两 个 产品 之 间 没 有 必然 的 关联 。Java 编 译 器 在 理论 上 能 编译 得 到 PowerPC ( 较 
早 的 Macintosh 计 算 机 的 基础 硬件 ) 的 本 地 代码 而 不 是 编译 为 JVM 字 节 码 ， 而 任何 其 他 语言 的 
编译 器 也 可 编译 得 到 JVM 代 码 。 


PowerPC 
可 执行 码 





奔腾 版 本 


二 区 


PowerPC 版 本 
图 1-13 硬件 兼容 性 和 虚拟 机 
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特别 地 ， 请 见 图 1-14 中 的 程序 。 这 是 一 个 简单 的 Java 程 序 示 例 ， 其 功能 是 输出 一 个 给 定 的 
串 到 缺 省 的 系统 输出 ， 通 常 是 当前 活动 窗口 。 这 个 程序 ， 或 者 类 似 的 程序 ， 常 常 是 任何 初级 
编程 课程 的 第 一 个 标准 示例 ， 虽 然 有 时 程序 也 可 能 是 打开 一 个 窗口 并 显示 一 个 消息 。 然 而 ， 
当 更 详细 地 考察 时 ， 却 发 现 Java 程 序 本 身 没 做 任何 这 类 事情 。 为 了 得 到 执行 ， 它 必须 首先 通 
过 某 种 转换 程序 (编译 器 ) 来 生成 一 个 可 执行 的 类 文件 。 只 有 这 个 类 文件 才能 运行 以 产生 期 
望 的 输出 。 

Java 或 任何 编程 语言 ， 更 适 于 被 看 作 是 用 于 指定 计算 机 所 执行 计算 的 一 种 结构 。 用 任何 
语言 写 的 程序 都 是 对 一 种 特定 计算 的 规范 。 为 了 使 计算 机 完成 工作 ， 这 种 规范 (程序 ) 必须 
被 转换 成 机 器 码 ， 计 算 机 最 终 将 其 辨析 为 一 个 程序 步 又 序列 。 


public class JavaExample { 
public static void mainCString [] args) { 


System.out .printin("This is a sample program."); 
} 





图 1-14 Java 程 序 样 例 


1.4.2 样 例 程序 的 转换 

通常 有 很 多 方式 来 指定 一 个 给 定 的 计算 。 可 用 很 多 其 他 语言 写 出 一 个 非常 类 似 的 程序 。 例 
如 ， 图 1-15、1-16、1-17 显 示 了 用 C、Pascal 及 C++ 写 出 的 具有 相同 行为 的 程序 。 这 些 程序 在 总 
体 结构 上 也 显示 出 极 大 的 相似 性 。 程 序 的 核心 是 一 行 代码 ， 以 某 种 方式 访问 一 个 固定 的 串 
(由 ASCII 字 符 组 成 ) 并 调用 一 个 标准 库 函 数 将 其 传递 到 缺 省 的 输出 设备 。 其 差别 是 微妙 的 并 
涉及 细节 。 例 如 ，Pascal 程 序 有 一 个 名 字 (PascalExample) ， 而 C 和 C++ 版 本 没有 。 在 C 和 C++ 
中 ， 程 序 必须 都 显 式 地 表示 行 末 回 车 ， 而 Java 和 Pascal 有 一 个 功能 ， 可 自动 在 行 末 加 一 个 回 车 。 
然而 ， 这 些 差 异 与 显著 的 相似 性 相 比 就 相当 小 了 ， 尤 其 是 考虑 这 与 机 器 码 之 间 的 差异 时 。 


#include <stdio.h> 


int mainO 


(void) printf("This is a sample program.\n"); 
} 





图 1-15 C 程 序 样 例 
Program PascalExample(output); 


begin 
writeln ('This is a sample program.'); 





end. 


图 1-16 _ Pascal 程序 样 例 


using namespace std; 
#include <iostream.h> 
int main€) 

I 


} 


cout << "This is a sample program." << end]; 





图 1-17 C++ 程 序 样 例 


2 


根据 前 面 对 典 型 计算 机 的 体系 结构 和 组 织 的 讨论 ， 考 虑 以 下 问题 : 很 少 CPU (如 果 有 的 
话 ) 在 ALU 或 控制 器 内 有 足够 的 寄存 器 来 存储 整个 串 。( 的 确 如 此 ， 因 为 在 抽象 中 对 串 的 长 度 
没有 一 个 必要 的 上 界 。 否 则 的 话 ， 计 算 机 就 不 会 只 输出 一 个 句子 ， 而 是 输出 整个 课本 了 。) 没 
有 CPU 能 用 单个 指令 将 串 输出 到 屏幕 。 代 之 的 是 ， 编 译 器 必须 将 程序 分 解 成 足够 小 的 步 又 ， 
这 些 步 又 都 在 计算 机 的 指令 集 之 内 。 

D 串 本 身 必须 存储 在 计算 机 存储 器 中 的 某 个 地 方 ; 

2) CPU 必须 确定 存储 位 置 

3) CPU 还 必须 确定 哪个 外 设 输出 消息 ， 

4) 必须 确定 消息 的 类 型 是 什么 ， 

5) 必须 将 适当 的 指令 传递 到 外 设 ， 

6) 告诉 外 设 串 的 存储 位 置 

7) 告诉 外 设 该 串 是 一 个 串 (不 是 一 个 整数 或 是 一 个 浮 点 数 ) ， 

8) 告诉 外 设 做 适当 的 动作 将 串 输出 (可 能 还 要 自动 加 上 一 个 回 车 )。 

一 行 代码 可 能 要 转换 成 8 个 或 更 多 的 计算 机 必须 执行 的 单个 操作 。 事 实 上 ， 单 行 代 码 中 所 
包含 的 要 执行 的 操作 数量 没有 限制 。 像 如 下 的 Java 代 码 

i = 1+2+3+4+5+6+7+8+9+10 ; 


对 每 个 加 法 都 需要 一 个 操作 ， 故 在 此 情况 下 就 有 9 个 单独 的 计算 。 由 于 对 数学 公式 的 理论 
复杂 度 没 有 限制 ， 因 此 对 单个 Java 语 名 的 复杂 度 也 没有 限制 。 


1.4.3 高 级 语言 和 低级 语言 

将 很 多 机 器 语言 指令 封装 到 单行 代码 是 高 级 (high-level) 语言 的 典型 特征 。Java、Pascal 
等 是 这 种 语言 的 典型 例子 。Java 编 译 器 的 任务 就 是 接受 复杂 的 语句 或 表达 式 并 生成 适合 的 机 
器 语言 序列 来 执行 这 个 任务 。 

与 此 形成 对 照 的 是 ， 低 级 (low-level) 是 以 机 器 语言 中 的 操作 与 程序 代码 中 的 语句 之 间 
有 非常 紧密 的 关系 为 特征 的 。 采 用 这 个 定义 ， 机 器 语言 当然 是 一 种 非常 低级 的 语言 ， 因 为 一 
个 机 器 语言 程序 与 其 自身 之 间 总 有 一 个 1 对 1 的 关系 。 汇 编 语言 (assembly language) 是 一 个 
对 人 而 言 稍微 易 读 的 语言 ， 但 仍 是 低层 语言 ， 其 设计 是 为 了 提升 对 机 器 及 机 器 代码 指令 的 总 
体 控制 ， 但 仍 保证 程序 员 可 读 并 理解 。 汇 编 语言 也 以 汇编 语言 指令 与 机 器 代码 指令 之 间 的 1 对 
1 关系 为 特征 。 

在 机 器 语言 中 ， 指 令 的 每 个 要 素 (也 称 为 操作 码 opcode， 是 operation code 的 简写 ) 像 计 
算 机 中 的 其 他 任何 内 容 一 样 是 一 个 数 。 前 一 节 提 到 操作 码 89 (0x59) 对 JVM 是 有 意义 的 ， 它 
将 导致 JVM 复 制 一 部 分 信息 。 在 汇编 语言 中 ， 对 每 个 操作 码 都 给 出 一 个 助 记 符 (mnemonic) 
( 读 做 “num-ON-ik”， 来 自 希腊 文字 ， 是 记忆 的 意思 ) ， 它 解释 或 概述 了 该 指令 确切 要 做 的 工 
作 。 与 操作 码 89 对 应 的 助 记 符 是 dup， 是 “duplicate” 的 简写 。 类 似 地 ， 助 记 符 iadd 是 
“integer add” 的 简写 ， 对 应 于 执行 整数 加 法 的 机 器 码 。 转 换 程 序 在 这 里 称 为 汇编 器 
(assembler) ， 其 任务 是 将 每 个 助 记 符 转换 成 适当 的 二 进 制 操作 码 的 形式 ， 并 收集 计算 机 所 需 
要 的 数据 ( 见 图 1-18)。 
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图 1-18 编程 过 程 





1.4.4 JVM 所 看 到 的 样 例 程序 

上 面 样 例 程序 的 JVM 机 器 码 版 本 将 会 是 很 长 且 大 部 分 不 可 读 的 二 进 制 串 。 图 1-19 显 示 出 
与 机 器 码 对 应 的 程序 版 本 。 该 程序 用 低层 次 JVM 汇 编 语 言 jasmin 手 工 写 成 ， 但 也 可 根据 原始 
的 样 例 程 序 通过 一 个 编译 器 生成 。 注 意 程序 要 长 许多 ， 几 乎 是 30 行 而 不 是 只 有 3 行 或 4 行 ， 并 
且 更 难于 理解 。 这 是 因为 在 写 高 级 语言 程序 时 你 认为 理所当然 的 很 多 事情 在 这 里 就 必须 精确 
和 明白 地 予以 指明 。 例 如 ， 在 Java 中 ， 除 非 另外 指定 ， 每 个 类 隐 含 地 都 是 一 个 Object 类 型 的 子 
类 。 而 IVM 则 要 求 明 确 地 定义 每 个 类 与 其 他 类 的 关系 。 图 1-19 中 的 注释 (以 分 号 ;开头 ) 对 于 
如 何 精确 地 定义 和 完成 〈( 隐 含 ) 操作 给 出 了 更 为 详细 的 、 逐 行 的 描述 (面向 人 类 阅读 者 )。 

要 注意 ， 虽 然 在 Java 中 明确 地 支持 和 使 用 类 、 子 类 等 概念 ， 但 在 本 节 中 给 出 的 JVM 低 级 
语言 程序 中 并 没有 特别 针对 Java 的 内 容 。 事 实 上 ， 就 像 Java 编 译 器 的 任务 是 将 高 级 Java 代 码 转 
换 成 类 似 于 JVM 的 机 器 码 一 样 ，C++ 或 Pascal 编 译 器 的 任务 是 对 特定 平台 的 程序 代码 做 同样 的 
事情 。 没 有 理由 认为 Pascal 编 译 器 不 能 设计 成 生成 JVM 码 而 不 是 PowerPC 或 奔腾 机 器 码 作 为 最 
终 (编译 ) 输出 。 程 序 然后 就 运行 于 一 个 JVM 上 (例如 ， 运 行 在 一 个 web 浏览 器 中 的 JVM 仿 
真 器 上 ， 或 者 像 较 早 提 到 的 专用 芯片 上 ) ， 而 不 是 特定 的 芯片 硬件 上 ( 见 图 1-20)。 
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; 定义 相关 的 类 文件 为 jasminExample.class 
.Class public jasminExample 

; 定义 jasminExamp1e 为 0bject 的 子 类 
.SUper java/lang/Dbject 


， 创建 对 象 所 需 的 标准 步 又 
.method public <init>()Y 
aload_0 


invokespecial java/lang/0bject/<init> OV 
return 
.end method . 


-method public static main([Ljava/lang/String;)V 
; 对 于 System.out 和 字符 串 ， 我 们 需要 两 个 堆栈 元 素 


.limit stack 2 


; 寻找 System.out (一 个 PrintStream 类 型 的 对 象 ) 
5 并 将 其 放 入 堆栈 
getstatic java/lang/System/out Ljava/io/PrintStream:; 


+ 寻找 要 打印 的 串 〈 字 符 ) 
; 并 将 其 放 人 堆栈 
ldc "This is a sample program." 


; 调用 PrintStream/print1n 方 法 
invokevirtual java/io/PrintStream/println(Ljava/lang/String;)V 


; .. :大功 告 成 | 
return 
.end method 





图 1-19 JVM 汇 编 语言 的 样 例 程序 


Java 了 玛 Jasmin 码 JVM 机 器 码 


一 1 十 2 十 3 十 4 十 3; bipush 1 Ox10 
" + Ox01 
bipush 2 Ox10 

0x02 

iadd Ox60 

bipush 3 Ox10 

Ox03 


iadd 0x60 
bipush 4 0x10 
Ox04 


iadd Ox60 
bipush 5 0x10 

Ox05 
iadd 0x60 
istore_1 Ox3c 





图 1-20 Java、jasmin 以 及 JVM 机 器 码 中 的 样 例 表达 式 (细节 见 下 一 章 ) 
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1.5 本 章 回顾 


“计算 机 只 是 高 速 执 行 算法 的 设备 ， 其 作为 电子 设备 的 构造 细节 并 没有 其 作为 信息 处 理 设 
备 的 工作 细节 那样 重要 。 

* 计算 机 的 主要 部 件 是 中 央 处 理 单元 (CPU) ，CPU 又 包含 控制 单元 、 算 术 和 还 辑 单元 
(ALU)、 以 及 浮 点 单元 (FPU)。 这 就 是 所 有 计算 实际 发 生 的 地 方 和 程序 实际 运行 的 地 方 。 
* 存储 器 和 外 设 通 过 一 组 总 线 连接 到 CPU， 总 线 携带 到 达 CPU 和 来 自 CPU 的 信息 。 

“所 有 存储 在 传统 计算 机 中 的 值 都 以 二 进 制 数字 或 位 的 方式 存储 。 为 方便 起 见 ， 这 些 位 组 
成 较 大 的 单位 如 字 节 和 字 。 一 个 特定 的 位 模式 可 能 有 若干 种 解释 ， 如 一 个 整数 、 一 个 浮 
点 数 、 一 个 字符 或 一 序列 字符 ， 甚 至 计算 机 本 身 的 一 组 指令 。 确 定 一 个 给 定 的 位 模式 代 
表 哪 种 类 型 的 数据 取决 于 上 下 文 并 在 很 大 程度 上 是 程序 员 的 责任 。 

“不 同 的 CPU 芯片 有 不 同 的 指令 集 ， 代 表 CPU 能 做 的 不 同事 情 和 做 事情 的 方式 。 每 个 CPU 
需要 以 不 同 机 器 语言 写成 的 可 执行 程序 ， 即 使 运行 相同 的 程序 。 

* 虚拟 机 是 一 个 程序 ， 运 行 于 真实 CPU 之 上 ， 并 解释 机 器 指令 就 好 像 它 本 身 是 一 个 CPU 芯 
片 。Java 虚 拟 机 (JVM) 就 是 这 种 程序 的 一 个 常见 例子 ， 在 几乎 每 台 计算 机 和 每 个 Web 
浏览 器 上 都 可 能 找到 。 

* 虚拟 机 比 传统 基于 硅 的 CPU 有 很 多 优势 ， 如 可 移植 性 、 很 少 的 硬件 限制 、 易 于 升级 以 及 
安全 性 。 虚 拟 机 可 能 在 速度 上 有 很 大 劣势 。 

“ Java 是 能 将 很 多 机 器 码 指令 结合 成 单个 语句 的 高 级 语言 的 例子 。C、Pascal 和 C++ 是 类 似 
的 高 级 语言 。 这 些 语 言 必 须 进行 编译 ， 将 其 代码 转换 成 机 器 可 执行 的 格式 。 

* 低级 语言 如 汇编 语言 在 程序 语句 与 机 器 指令 之 间 有 一 个 紧密 的 、 通 常 是 1 对 1 的 关系 。 
“Java 与 JVM 之 间 没 有 必然 的 联系 。 多 数 Java 编 译 器 能 编译 到 JVM 可 执行 码 ， 但 是 C、 
C++ 编译 器 也 能 做 到 这 一 点 。 类 似 地 ， 一 个 Java 编 译 器 能 编译 到 奔腾 4 本 地 码 ， 但 是 所 产 
生 的 程序 不 能 在 Macintosh 计 算 机 上 运行 。 


1.6 习题 


1. 什么 是 算法 ? 
2. 京 调 书 中 给 出 的 食谱 是 算法 的 例子 吗 ? 
3. 给 出 以 下 每 句 短语 中 所 描述 的 计算 机 部 件 的 名 字 : 
* 计算 机 的 心脏 和 最 终 控制 器 ， 所 有 计算 执行 的 地 方 
“负责 在 机 器 内 部 移动 数据 的 计算 机 部 件 
* 负责 所 有 计算 ， 如 加 靶 、 减 法 、 乘 法 及 除法 的 计算 机 部 件 
“一 组 线 ， 用 于 对 不 同 设备 进行 互 连 以 实现 数据 连接 
“用 于 读 、 显 示 或 存储 数据 的 设备 
* 用 于 短期 存储 数据 和 执行 程序 的 地 方 
4. 在 一 个 16 位 的 寄存 器 中 能 存储 多 少 种 不 同 的 模式 ? 在 这 样 一 个 寄存 器 中 ， 能 存储 为 (二 进 
制 补 码 ) 有 符号 整数 的 最 大 值 是 什么 ? 最 小 值 是 什么 ?能 存储 为 无 符号 整数 的 最 大 和 最 小 
值 是 什么 ? 
5. 将 下 面 16 位 二 进 制 数 转 换 成 十 六 进 制 数 和 有 符号 十 进 制 数 〈 你 不 能 使 用 计算 器 : ) : 


e 1001110011101110 
e 1111111111111111 
es 0000000011111111 
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e 0100100010000100 
e 1111111100000000 
es 1100101011111110 
6. 将 下 面 32 位 IEEE 浮 点 数 从 十 六 进 制 转换 成 标准 的 十 进 制 表示 。 

e 0x40200000 

e Ox41020000 

e OxC1060000 

。 0xBD800000 

ea Ox3EAAAAAB 

e 0x3F000000 

e 0x42FA8000 

® 0x42896666 

e 0x47C35S000 

e Ox4B189680 


7. 将 下 面 十 进 制 数 转换 成 32 位 IEEE 浮 点 表示 。 


se 2.0 

e 45.0 

e 61.01 

© 一 18.375 

e 一 6.68 

e@ 65536 

e 0.000001 

e 10000000.0 


8. 能 精确 地 表示 成 32 位 整数 但 却 不 能 表示 成 32 位 IEEE 浮 点 数 ， 存 在 任何 这 样 的 数 吗 ?为 什么 ? 

9. 采用 标准 的 ASCII 表 (查看 因特网 或 附录 E)， 什 么 样 的 4 个 十 六 进 制 字 节 代表 串 “Fred”? 

10. 哪个 ASCII 字 符 串 与 十 六 进 制 数 0x45617379 相 对 应 ? 

11. 对 或 错 : 二 进 制 位 数 越 多 ， 值 就 越 大 。 为 什么 ? 

12. 为 什么 为 Windows 奔 腾 4 生 成 的 可 执行 文件 不 能 运行 于 基于 PowerPC 的 Macintosh 上 (在 没 
有 特殊 的 软件 支持 的 情况 下 ) ? 

13. 虚拟 机 相 比 基于 芯片 的 体系 结构 的 最 重要 的 优点 是 什么 ? 

14. 最 重要 的 缺点 是 什么 ? 

15. 什么 语言 可 用 于 为 JVM 写 程序 ? 

16. 对 应 于 下 面 语句 有 多 少 条 低级 机 器 指令 ? 


Xx=at+(b*c)+(d*e); 


1.7 编程 习题 


以 下 题 用 教师 同意 的 任何 语言 写 一 个 程序 。 

1. 读 入 一 个 32 位 (二进制 ) 有 符号 整数 ， 并 输出 与 其 等 值 的 十 进 制 数 。 

2. 读 入 一 个 32 位 (二进制) 浮 点 数 ， 并 输出 与 其 等 值 的 十 进 制 数 。 

3. 读 入 一 个 十 进 制 浮 点 数 ， 并 输出 与 其 等 值 的 下 EE 64 位 十 六 进 制 数 。( 注 意 : 也 许 需 要 额外 的 读 人 ) 

4. (以 十 六 进 制 IEEE 格 式 ) 读 人 两 个 32 位 浮 点 数 A 和 B ， 并 以 十 六 进 制 输出 它们 的 乘积 A. B。 
不 要 在 内 部 转换 成 十 进 制 浮 点 数 再 利用 语言 的 乘法 操作 进行 乘积 计算 。 

5. (以 十 六 进 制 IEEE 格 式 ) 读 入 两 个 32 位 浮 点 数 A 和 B ， 并 以 十 六 进 制 输出 它们 的 和 A+B。 
不 要 简单 地 转换 成 十 进 制 再 进行 加 法 计算 。 

6. 《以 十 六 进 制 ) 读 入 一 个 32 位 浮 点 数 A， 并 以 十 六 进 制 和 十 进 制 输出 其 倒数 1.0/A。 你 能 使 
用 该 程序 结合 程序 4 完成 浮 点 除法 吗 ? 怎么 做 ? 


第 2 章 算术 表达 式 


2.1 符号 表示 


2.1.1 指令 集 
计算 机 的 两 个 中 心 问题 (也 许 确实 是 两 个 中 心 问题 )， 是 其 缺乏 想象 以 及 能 做 的 事情 有 限 。 
考虑 用 一 个 典型 的 袖珍 计算 器 计算 下 面 的 问题 (图 2-1)， 

一 个 底面 直径 450 米 ， 高 150 米 的 圆 形 山 的 体积 是 多 少 ?用 几 分 钟 查 
一 下 几何 课本 你 就 会 得 到 公式 ， 圆 锥 的 体积 是 底面 面积 和 高 度 的 乘积 的 
三 分 之 一 。 底 贺 的 面积 是 7 乘 以 半径 的 平方 。 半径 是 直径 的 一 半 。z 的 什 
当然 是 3.14 多 一 点 。 综 合 起 来 ， 答 案 就 是 ， -一 一 

工 [1450Y 1.150 图 2-1 一 个 锥 形 山 
3| \2J 

你 如 何 计算 这 个 麻烦 的 公式 ? 

这 里 就 是 计算 机 (在 这 个 例子 中 就 是 计算 器 ) 的 指令 集 扬眉吐气 的 地 方 。 这 个 公式 不 能 
按 原样 输入 到 一 个 典型 的 计算 器 。 它 需要 被 分 解 成 计算 器 或 计算 机 能 处 理 的 很 小 的 片断 。 只 
有 这 种 小 片断 的 一 个 序列 才能 使 我 们 得 到 最 后 的 答案 。 这 与 传统 的 计算 机 编程 没有 差别 ， 只 
不 过 这 种 计算 器 所 采用 的 片断 比 Java 等 高 级 语言 所 用 的 要 小 得 多 。 

根据 所 使 用 的 计算 器 不 同 ， 有 若干 种 不 同 的 按键 序列 可 解决 这 个 问题 。 在 一 个 典型 的 高 
端 计算 口上， 下面 的 序列 可 计算 { 人 ) ， 

图 四 回回 四 回回 四] 


或 者 ， 也 可 用 : 


国 加 四 上 回回 加 


整个 计算 可 如 下 进行 : 
国 四 本 上 西口 攻略 回回 让 四 四 四 口 四 回 加 


2.1.2 操作 、 操 作 数 及 顺序 

这 里 隐 含 了 一 些微 妙 的 东西 。 首 先 注意 这 个 计算 器 的 “指令 集 ” 包 括 一 个 [好 |] 按钮， 使 得 
按 一 下 按键 就 能 得 到 一 个 数字 的 平方 值 。 它 还 有 一 个 x 按钮 。 没 有 这 些 便 利 ， 就 需要 更 多 的 按 
键 和 更 高 的 复杂 性 。 事 实 上 ， 儿 乎 没有 人 知道 什么 样 的 按键 序列 能 代替 |Vz|] 按 钮 。 

其 次 ， 这 个 序列 中 的 顺序 很 重要 。 就 像 450 与 540 之 间 存 在 差异 一 样 ，450 二 2 与 450 2 慎之 
闻 也 存在 差异 。 前 一 个 得 出 的 值 是 225， 而 后 一 个 甚至 没有 意义 (在 传统 的 符号 意义 下 ) 。 一 
般 来 说 ， 人 们 想到 的 多 数 数学 操作 是 二 元 的 (binary) ， 也 就 是 说 ， 这 些 数学 操作 接受 两 个 数 
字 (就 是 参数 ， 正 式 的 称谓 是 操作 数 (operand)) 并 产生 第 三 个 数 作为 结果 。3 和 4 相 加 就 得 7。 
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一 些 高 级 的 数学 操作 ， 如 sinx、cosx 及 logx 是 一 元 的 (unary) ， 意 思 是 它们 只 接受 一 个 参数 。 
为 了 处 理 一 个 操作 ， 计 算 机 同时 需要 有 定义 执行 哪 种 操作 的 操作 符 (operator) 和 所 有 必需 的 
操作 数 的 值 ， 并 且 要 以 非常 严格 的 格式 给 出 。 

例如 ， 按 传统 在 黑板 上 书写 数学 公式 时 ， 二 元 操作 写成 中 缀 (infix) 形式 ， 意思 是 操作 
符 写 在 两 个 操作 数 的 中 间 (如 3 二 4)。 三 角 函 数 如 sin 写 成 前 组 (prefix) 形式 ， 即 操作 符 在 操 
作 数 之 前 (各 sin = )。 一 些 高 端 计算 器 如 惠普 HP 49G 还 支持 后 组 (postfix) 形式 (也 称 为 逆 


波兰 表示 (reverse Polish notation))， 即 操作 符 放 在 操作 数 最 后 。 在 这 样 的 计算 器 上 ， 计 算 
450 除 以 2 所 需要 的 按钮 序列 是 : 

[4jlsjlol[eNTER]E2][E] 

虽然 这 个 表示 乍 看 起 来 有 些 令 人 费解 ， 但 很 多 人 在 有 了 一 点 经 验 后 更 乐于 使 用 它 ， 其 原 
因 我 们 将 在 后 面 介 绍 。 


2.1.3 基于 堆栈 的 计算 器 

这 种 类 型 的 计算 器 《采用 逆 波 兰 表示 ) 采用 称 为 堆栈 (stack) 的 数据 结构 很 易于 建 模 。 
这 个 术语 来 源 于 自助 餐厅 中 登 在 一 起 的 盘子 或 快餐 馆 中 的 泡沫 塑料 杯 ( 见 图 2-2) 所 呈现 的 景 
象 。 这 样 的 杯子 通常 操 在 弹簧 支撑 的 容器 中 ， 杯 子 的 重量 将 整个 一 堆 杯 子 压 下 使 得 顶 上 的 杯 
子 总 是 保持 在 一 个 不 变 的 高 度 。 在 任何 时 候 ， 只 有 项 上 的 杯子 被 移 走 (导致 堆 的 其 余部 分 向 
上 略微 弹出 并 露出 一 个 新 的 杯子 ) 或 者 可 在 顶 上 再 放 进 一 个 杯子 将 杯子 略微 向 下 压 。 用 稍微 
抽象 的 术语 说 ， 只 有 顶 上 的 对 象 是 可 访问 的 。 






只 有 堆栈 顶 上 的 杯子 是 可 访问 的 


当 顶 上 的 杯子 被 移 走时 ， 
为 了 保持 顶 上 的 杯子 可 访问 
弹簧 支撑 的 托盘 将 杯子 向 上 托 

图 2-2 自助 餐厅 的 一 堆 杯子 


堆栈 是 一 组 具有 类 似 访问 性 质 的 数字 或 数据 对 象 。 只 有 “顶部 ”的 对 象 是 可 处 理 的 ， 它 
可 以 在 任何 时 候 被 移 走 〈“ 弹 出 ”) ， 另 外 的 一 个 对 象 可 以 加 入 〈“ 压 入 ”) 堆栈 而 取代 原来 的 顶 
部 对 象 成 为 新 的 顶部 对 象 (原来 的 顶部 对 象 就 处 于 距 顶 部 的 第 二 个 位 置 ， 依 次 类 推 )。 基 于 堆 
栈 的 计算 尤其 适用 于 后 级 表达 式 。 各 个 项 依次 压 入 堆栈 。 对 于 像 sin 和 cos 这 样 的 一 元 操作 ， 可 
简单 地 弹出 堆栈 顶部 的 项 作为 操作 数 ， 然 后 执行 这 个 操作 ， 再 将 结果 压 人 。 对 于 像 加 法 这 样 
的 二 元 操作 ， 就 弹出 堆栈 顶部 的 两 项 ， 然 后 执行 操作 ， 再 将 结果 压 回 堆栈 。 
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下 面 的 操作 序列 执行 了 上 面 所 描述 的 计算 : 
13+ x :4502 二 45302 二 :150. 
打开 这 个 序列 ， 前 面 的 数字 1 和 3 被 压 入 堆栈 。 然 后 ， 这 两 个 数 被 弹出 并 计算 出 其 商 为 1/3 
即 0.3333。 压 人 r 值 ， 然 后 0.3333 和 r 相 乘 ， 得 1.047， 依 次 类 推 。 计算 可 按 序列 快速 执行 ,无 
需 使 用 括号 和 结构 。 特 别 要 注意 ， 操 作 的 顺序 不 会 有 二 义 性 ， 而 这 种 情况 却 可 能 在 中 缀 表达 
式 中 出 现 ， 比 如 1 +3 . 4。 两 种 可 能 的 等 价 表 达 式 是 1 34 . + 和 1 3 + 4 显而易见 是 不 同 的 。 


2.2 存储 程序 计算 机 


2.2.1 取 指 一 执行 周期 

计算 机 在 进行 计算 时 ， 当 然 不 需要 人 通过 操作 设备 (通过 按钮 ) 直接 与 其 打交道 ， 而 是 
将 每 个 可 能 的 操作 存储 成 位 模式 (如 前 面 章 节 所 述 )。 操 作 的 序列 就 存储 成 包含 位 模式 序列 的 
程序 。 计 算 机 通过 读 存 储 器 (到 控制 单元 ) 而 获得 指令 ， 并 将 每 个 位 模式 解释 成 要 执行 的 操 
作 。 这 通常 称 为 取 指 -执行 周期 (fetch-execute cycle) ， 因 为 这 种 执行 是 周期 性 的 和 无 限 的 ， 
在 计算 机 中 每 秒 要 运行 几 百 万 或 几 十 亿 次 ( 见 图 2-3)。 


第 三 条 指令 
第 四 条 指令 










[Eee 
rc EE 


图 2-3 取 指 一 执行 周期 
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控制 单元 内 部 至 少 有 两 个 重要 的 存储 位 置 。 第 一 个 是 指令 寄存 器 (instruction register) 
即 IR， 它 保存 了 刚 从 存储 器 中 取 来 的 位 模式 ， 因 而 该 位 模式 可 以 得 到 解释 。 第 二 个 是 程序 计 
数 器 (program counter) 即 PC， 它 保存 了 要 取出 下 一 条 指令 的 地 址 。 在 正常 情况 下 ， 每 次 取 
出 一 条 指令 ，PC 递 增 并 指向 存储 器 中 下 一 个 字 。 例 如 ， 如 果 PC 包 含 模式 0x3000， 则 下 一 条 指 
令 就 将 从 这 个 地 址 取出 (解释 成 一 个 存储 器 地 址 )。 这 意味 着 存储 在 地 址 0x3000 处 的 位 模式 
(不 是 0x3000 本 身 ) 将 被 放 到 IR。PC 然 后 得 到 更 新 ， 存 储 的 新 值 是 0x3001。 在 以 后 的 连续 周 
期 中 ，PC 将 包含 0x3002、0x3003、0x3004 等 等 。 在 每 个 这 样 的 周期 中 ，IR 包 含 计算 机 要 执行 
的 指令 。 指 令 的 典型 例子 包括 数据 传输 (数据 在 CPU 和 存储 器 或 1O 外 设 间 移动 )、 数 据 处 理 
(对 已 经 在 CPU 中 的 数据 做 一 些 算术 和 逻辑 操作 ) ， 或 者 影响 到 控制 单元 本 身 的 控制 操作 。 

对 指令 加 以 解释 本 身 是 一 个 中 等 复杂 度 的 任务 ， 部 分 原因 是 某 些 指令 实际 上 是 需要 进 一 
步 详细 说 明 的 指令 组 。 例 如 ， 将 信息 存 到 存储 器 的 指令 是 不 完备 的 。 什 么 信息 要 存储 ? 要 存 
储 到 存储 器 中 的 哪个 位 置 ? 此 外 ， 很 多 机 器 需要 更 多 的 细节 ， 如 “ 寻 址 模式 ”( 这 个 位 模式 指 
的 是 一 个 存储 器 位 置 还 是 指 一 个 数 呢 ? ) 、 要 存储 的 数据 的 大 小 (字数 ) 等 等 。 基 于 这 个 原因 ， 
很 多 机 器 语言 指令 实际 上 是 相关 位 的 综合 体 (就 像 前 面 一 章 中 浮 点 数 的 详细 结构 一 样 ) 。 

针对 IBM-PC (Intel 8086 及 更 晚 的 机 器 ) 的 一 个 例子 是 简单 的 ADD 指 令 。 这 个 指令 可 编码 为 两 
个 字 节 ， 其 中 第 一 个 8 位 保存 的 数 是 0x04， 第 二 个 8 位 保存 一 个 无 符号 的 从 0 到 255 的 8 位 数 。 这 个 数 
隐 含 地 将 被 加 到 已 经 存储 在 特定 位 置 ( 即 AL 寄 存 器 ，CPU 中 一 个 特殊 的 8 位 寄存 器 ) 的 数 上 。 如 
果 你 需要 加 一 个 大 于 255 的 数 ， 就 要 用 一 个 不 同 的 机 器 指令 ， 这 个 指令 的 第 一 个 字 节 是 0x05， 接 下 
来 的 16 位 定义 了 一 个 从 0 到 65 525 之 间 的 数 。 如 果 你 想 将 数 加 到 一 个 不 在 AL 寄存 器 的 数 中 ， 则 机 器 
指令 就 以 操作 代码 字 节 0x81 开 头 ， 第 二 个 字 节 定义 数 存 储 的 地 址 ， 然 后 定义 将 要 被 加 的 数 。 

由 于 JVM 体 系 结构 所 选择 的 设计 (特别 是 ， 所 有 加 法 都 在 一 个 地 方 ( 即 堆栈 中 ) 完成 )， 使 得 
在 JVM 上 的 相应 解释 任务 较为 容易 〈 见 图 2-4)。 下 一 节 中 将 会 讨论 到 ， 这 既 反 映 了 设计 者 的 基本 
设计 理念 也 反映 了 JVM 本 身 的 能 力 。 例 如 ， 所 有 的 加 法 都 在 堆栈 上 完成 (就 像 在 RPN 计 算 器 中 一 
样 )。 这 意味 着 计算 机 不 需要 担心 加 数 来 自 哪 里 (因为 它们 总 是 来 自 堆栈 ) 或 者 相 加 所 得 的 和 送 到 
哪里 (因为 它 总 是 送 回 到 堆栈 )。 这 样 ， 两 个 数 相 加 的 指令 就 是 一 个 单字 节 的 值 0x60， 不 会 混淆 。 


x [Eo 
x Ez 


下 
PC | ox600A 


图 2-4 在 JVM 上 基于 堆栈 的 计算 示意 图 
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补充 资料 

存储 程序 计算 机 和 冯 “, 诺 依 曼 体 系 结构 

第 一 台 计算 机 产生 于 第 二 次 世界 大 战 中 的 弹道 计算 器 和 密码 破译 机 。 将 它们 称 为 计算 
机 几乎 是 不 对 的 ， 因 为 它们 实际 上 仅仅 是 复杂 的 专用 电气 设备 。 最 重要 的 是 ， 要 改变 它们 
的 用 途 ， 就 需要 改变 机 器 的 物理 电路 。 程 序 是 “ 硬 连 线 ”到 计算 机 中 的 。 如 果 需 要 求解 一 
个 不 同 的 问题 ， 你 就 要 重 连 机 器 并 建立 新 的 电路 。 

伟大 的 数学 家 约翰 冯 “' 诺 依 里 认 识 到 了 这 个 重大 的 局 限 性 并 为 建造 “通用 ”计算 机 
提出 了 (在 1946 年 与 Arthur Burks 和 Hermann Goldstine 合 写 了 “电子 计算 设备 座 辑 设计 的 
初步 讨论 ") 一 个 革命 性 的 概念 。 他 确定 了 计算 中 涉及 的 4 个 主要 的 “器官 ",， 分 别 与 运算 、 
存储 、 控 制 以 及 与 外 部 世界 (和 人 类 操作 者 ) 连接 有 关 。 根 据 他 的 观点 ， 建 立 通用 计算 机 
的 关键 是 : 计算 机 应 该 不 仅 能 存储 算术 运算 的 中 间 结 果 ， 还 能 存储 产生 这 些 计 算 的 (指令 ) 
顺序 。 换 和 名 话说 , “控制 器 官 ”应 该 能 从 存储 器 中 读 入 模式 并 依次 行动 。 而 且 ， 控 制 模式 
的 存储 应 该 与 数字 数据 的 存储 一 样 灵活 。 因 此 ， 为 什么 不 像 存储 数字 数据 一 样 将 指令 也 存 
储 成 二 进 制 模式 呢 ? 这 样 ， 控 制 器 官 的 设计 就 变 成 一 种 选择 器 ， 当 该 模式 被 从 存储 器 中 读 
出 时 ， 就 激发 相应 的 电路 。 冯 “' 诺 依 曼 进一步 指出 ， 如 果 存 在 某 种 方式 能 加 以 分 辨 ， 控 制 
模式 和 数据 模式 甚至 能 处 于 同一 存储 器 中 。 与 此 不 同 的 另 一 种 方式 (现代 计算 机 所 采取 的 
途径 ) 则 是 ， 两 者 的 区 分 不 是 通过 模式 ， 而 是 通过 用 途 。 任 何 装 入 到 控制 单元 中 的 模式 就 
自动 被 认为 是 指令 。( 一 个 与 其 竞争 的 体系 结构 称 为 哈佛 体系 结构 (Harvard architecture )， 
它 采 用 分 开 的 存储 器 分 别 存储 代码 和 数据 。 我 们 将 会 在 后 面 讨论 Atmel 微 控制 器 时 看 到 这 
种 体系 结构 ) 。 这 也 意味 着 指令 可 作为 数据 使 用 ， 甚 至 能 被 覆盖 ， 使 得 自修 改 代码 (self- 
modifying code) 成 为 可 能 。 这 使 得 计算 机 可 自行 重 编程 ， 比 如 ， 通 过 将 程序 (作为 数据 ) 
从 外 存储 器 拷贝 到 主 存储 器 ， 然 后 (作为 代码 ) 执行 程序 。 

冯 . 诺 依 曼 计算 机 的 操作 是 通过 重复 地 执行 以 下 操作 完成 的 . 

1) 从 存储 器 官 中 取得 一 个 指令 模式 。 

2) 确定 并 从 存储 器 中 取得 该 指令 所 需 的 数据 。 

3) 在 运算 器 官 中 对 数据 进行 处 理 。 

4) 将 运算 的 结果 存储 到 存储 器 官 中 。 

5) 返回 到 步骤 1。 

冯 ' 诺 依 曼 就 这 样 匡 定 了 当今 计算 机 大 部 分 的 理论 基础 。 例 如 ， 他 提出 的 四 个 器 官 可 
以 容易 地 与 ALU、 系 统 存 储 器 、 控 制 单 元 以 及 较 旱 定义 的 外 谈 对 应 起 来 。 他 提出 的 操作 方 
法 就 是 取 指 一 执行 循环 。 研 究 者 们 这 几 十 年 一 直 在 探究 冯 “' 诺 依 曼 体系 结构 ， 并 且 已 能 在 
某 些 方面 突破 他 的 模型 的 限制 。 鲍 如 ， 一 般 来 说 ， 多 处 理 器 系统 用 儿 个 CPU 代替 单 控制 器 
官 ， 每 个 CPU 可 独立 操作 。 一 个 更 激进 的 非 间 ' 谱 依 曼 体 系 结构 可 在 各 种 神经 网 络 和 连接 
系统 设计 中 和 看 到 ， 在 这 种 系统 中 , “存储 器 ”分 布 在 儿 十 到 几 千 个 互 锁 的 “单元 ”中 ， 并 
且 没 有 控制 器 官 。 今 天 ,“ 冯 ' 诺 依 曼 计算 机 ”这 个 术语 已 经 很 少 提 及 了 ， 就 像 鱼 不 会 党 
常 谈论 水 一 样 。 这 种 计算 机 无 所 不 在 ， 所 以 通常 假定 任何 给 定 的 机 器 都 遵循 冯 . 诺 依 曼 / 
存储 程序 体系 结构 。 





2.2.2 CISC 计 算 机 与 RISC 计 算 机 
显然 ，CPU 要 做 的 不 同事 情 越 多 ， 操 作 代码 和 机 器 指令 就 越 多 。 不 同 的 操作 代码 越 多 ， 
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需要 的 位 模式 就 越 多 ， 就 需要 (平均 ) 更 长 的 位 模式 以 确保 计算 机 能 将 它们 分 辩 开 来 。( 想 象 
一 下 ， 如 果 0x05 不 仅 是 “将 两 个 数 相 加 ”的 意思 ， 还 是 “停机 ”的 意思 ， 会 发 生 什么 样 的 灾 
难 ! 计算 机 怎么 能 区 分 出 它 究竟 是 什么 意思 呢 ? ) 然而 ， 更 长 的 操作 代码 就 意味 着 有 更 大 的 
IR， 就 意味 着 有 更 大 的 总 线 将 计算 机 连接 到 程序 存储 器 ， 也 就 意味 着 有 更 复杂 和 昂贵 的 电路 
来 解释 指令 。 因 为 每 个 操作 可 能 需要 不 同 的 连 线 和 蝇 体 管 ， 这 样 ， 一 个 复杂 的 指令 集 就 需要 
有 很 多 的 电路 来 执行 各 种 操作 。 这 意味 着 这 种 复杂 的 CPU 芯片 会 很 昂贵 ， 需 要 高 成 本 的 支持 ， 
并 且 与 更 简化 的 设计 相 比 每 条 指令 的 运行 更 慢 。( 而 且 还 需要 更 大 的 芯片 ， 运 行 时 更 热 [因此 
需要 有 更 好 的 冷却 系统 ]， 消 耗 更 大 的 功率 ， 降 低 了 电池 的 寿命 。) 

这 就 意味 着 更 小 的 指令 集 就 更 好 吗 ? 不 一 定 ， 因 为 虽然 具有 精简 指令 集 的 CPU 可 能 对 某 
些 任务 运行 得 更 快 〈 例 如 ， 每 个 CPU 都 需要 完成 两 个 数 相 加 的 能 力 ) ， 但 还 有 很 多 任务 ， 较 小 
的 CPU 需要 儿 个 步骤 才能 完成 。 例 如 ， 一 个 复杂 指令 集 计 算 (complex instruction set 
computing, CISC) 芯片 可 能 会 将 一 块 数据 ， 比 如 包含 有 几 千 字 节 的 串 ， 从 存储 器 中 的 一 个 位 
置 移动 到 另 一 个 位 置 而 无 需 使 用 CPU 内 部 的 任何 存储 器 。 与 此 相 比 ， 一 个 精简 指令 集 计 算 
(reduced instruction set computing, RISC) 芯 片 可 能 就 不 得 不 将 每 个 字 节 或 者 字 先 从 存储 器 移 
动 到 CPU， 然 后 再 移动 到 存储 器 。 更 重要 的 是 ， 在 每 个 步骤 ， 移 动 字 节 的 指令 都 要 被 取出 和 
解释 。 所 以 ， 虽 然 总 体 上 取 指 一 执行 周期 可 以 运行 得 更 快 (通常 也 确实 是 这 样 ) ， 但 特定 的 程 
序 或 应 用 却 需 要 用 很 多 指令 (很 慢 地 ) 完成 任务 ， 而 CISC 计 算 机 却 可 以 用 单条 (虽然 长 且 复 
杂 ) 的 指令 完成 同样 的 任务 。RISC 支 持 者 所 声称 的 另 一 个 优势 是 对 “ 洲 长 特性 主义 ” 
(creeping featurism) ( 即 设 备 和 程序 为 了 有 新 特性 而 增加 复杂 度 ) 的 抵御 。 一 个 RISC 芯 片 通 
常 有 一 个 小 的 、 纯 净 的 并 且 定 义 简 单 的 设计 ， 并 且 在 未 来 的 版 本 中 将 保持 这 种 小 而 纯净 且 简 
单 的 特点 。 而 CISC 的 较 新 版 本 通常 会 加 入 更 多 的 指令 、 更 多 的 特性 以 及 更 高 的 复杂 性 。 这 会 
带 来 很 多 影响 ， 其 中 之 一 就 是 阻碍 了 向 后 兼容 性 ， 因 为 给 较 晚 CISC 写 的 程序 通常 会 使 用 那些 
六 个 月 之 前 的 CISC 中 不 存在 的 特性 和 指令 。 当 然 ， 在 另 一 方面 ， 新 加 入 的 特性 也 许 对 工程 师 
们 是 有 用 的 。 

当前 市 场 上 的 两 款 主要 的 CPU 芯片 为 这 种 差异 提供 了 很 好 的 例证 。 奔 腾 4 是 CISC 芯 片 ， 有 具 
有 巨大 的 指令 集 〈 甚 至 不 考虑 使 用 哪个 寄存 器 或 存储 器 位 置 保存 数据 ， 单 是 ADD 就 已 有 34 种 
不 同 的 表示 方式 ) ， 而 PowerPC 是 一 个 RISC 芯 片 ， 其 设计 是 为 了 能 快速 执行 常见 的 操作 ， 对 罕 
见 或 复杂 任务 则 用 时 要 长 得 多 。 因 为 这 个 原因 ， 在 比较 两 个 CPU 间 的 处 理 速度 时 ， 我 们 不 能 仅 
仅 去 看 时 钟 速度 这 样 的 数字 。 在 RISC 蕊 片上 的 单个 时 钟 周期 一 般 对 应 于 单个 机 器 指令 ， 而 在 
CISC 上 做 任何 事 一 般 都 要 至 少 两 个 或 三 个 时 钟 周期 。 另 一 方面 ， 根 据 应 用 的 不 同 ，CISC 中 较 
大 的 指令 能 在 较 少 的 时 钟 周期 内 做 更 复杂 的 计算 。 这 样 ， 性 能 的 差异 就 更 取决 于 正在 运行 的 程 
序 类 型 和 具体 的 操作 而 不 是 时 钟 速 庶 的 差异 。 特 别 地 ， 荤 果 公 司 的 销售 文件 声称 ， 仅 仅 通过 在 
每 个 时 钟 周期 做 更 多 事情 ，(RISC) 865MHz 的 Power Mac G4 就 比 (CISC) 1.7GHz 的 奔腾 4 运 
行 起 来 平均 要 快 大 约 60% (图 形 和 音频 操作 要 快 3 到 4 倍 .…) 。 不 管 你 是 否 相信 苹果 公司 的 销售 
文件 ， 他 们 的 中 心 点 〈 即 时 钟 速度 并 不 适合 比较 不 同 的 CPU， 另 外 计算 机 的 指令 集 可 按 不 同 种 
类 的 任务 进行 设计 ) 仍 几 乎 是 不 可 辩驳 的 ， 而 无 论 在 这 场 CISCARISC 争 论 中 你 站 在 哪 一 边 。 


2.3 JVM 上 的 算术 运算 


2.3.1 一 般 评 述 
Java 虚 拟 机 是 基于 堆栈 的 RISC 处 理 器 的 一 个 示例 ， 但 要 注意 其 在 物理 上 是 不 存在 的 。 像 
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多 数 计算 机 一 样 ， 因 为 效率 的 原因 ，JVM 的 直接 算术 运算 能 力 限 于 常见 和 简单 的 操作 。 很 少 
有 计算 机 提供 三 角 函 数 ，JVM 也 是 这 样 ， 但 所 有 计算 机 都 支持 基本 的 算术 运算 ， 如 加 法 、 减 
靶 、 乘 法 及 除法 。 然 而 ， 通 过 采用 基于 堆栈 的 计算 (就 像 较 早 讨论 过 的 高 端 计算 器 )，JVM 超 
出 了 多 数 的 计算 机 。 这 使 得 在 其 他 计算 机 上 进行 仿真 非常 容易 ， 而 固定 数量 的 寄存 器 是 不 能 
实现 这 种 仿真 的 。JVM 本 身 维护 着 一 个 保存 二 进 制 模式 的 堆栈 ， 维 护 着 先前 压 和 的 元 素 和 早 
先 计算 的 结果 。 任 何 操作 的 操作 数 都 取 自 于 堆栈 顶部 的 元 素 ， 计 算 结 果 也 返回 到 堆栈 的 顶部 。 
要 计算 7 . (2+3)， 则 将 ?7、2、3 ( 按 顺 序 ) 压 人 堆栈 ， 然 后 ， 先 执行 加 法 再 执行 乘法 。 

因为 JVM (以 及 一 般 意 义 上 的 Java) 采用 有 类 型 (typed) 的 计算 ， 所 以 这 个 过 程 实现 得 
更 复杂 一 些 〈 在 这 一 点 上 ， 它 与 多 数 的 RISC 机 有 点 不 同 ， 但 它 提 供 的 安全 性 高 得 多 ) 。 就 像 
在 前 一 章 所 讨论 过 的 ， 相 同 的 位 模式 可 表示 若干 个 不 同 的 项 ， 而 相同 的 数 可 用 若干 种 不 同 的 
位 模式 表示 。 为 了 准确 地 处 理 这 些 问 题 ， 任 何 计算 机 都 需要 知道 由 位 模式 表示 的 数据 类 型 。 
JVM 仅 仅 是 在 如 何 严格 地 保证 这 种 类 型 系统 以 防止 程序 错误 方面 显得 不 同一 般 。 

因此 ， 根 据 加 法 操作 数 的 类 型 的 不 同 ， 就 有 若干 种 不 同 的 方式 来 表示 加 法 。( 这 也 许 就 将 
JVM 置 于 CISC/RSIC 争 论 的 中 间 某 个 地 方 ) 。 一 般 来 说 ， 操 作 名 的 首 字母 就 反映 了 所 期 望 的 参 
数 类 型 和 结果 类 型 。 要 将 两 个 整数 相 加 ， 就 使 用 助 记 符 iadd， 而 要 将 两 个 浮 点 数 相 加 ， 就 使 
用 助 记 符 fadd。 其 他 算术 操作 也 遵循 这 个 模式 ， 所 以 整数 相 减 的 操作 就 是 isub， 而 两 个 双 精 
度数 相 除 的 操作 就 是 ddiv。 

详细 地 看 ，JVM 堆 栈 是 一 组 32 位 数 的 集合 ， 没 有 固定 的 最 大 深度 。 对 于 可 以 放 入 32 位 寄 
存 器 的 类 型 ， 将 数据 元 素 存 到 一 个 堆栈 位 置 没有 问题 。 更 长 的 类 型 通常 存储 为 成 对 的 32 位 数 ， 
所 以 一 个 64 位 的 “ 双 精 度 ” 数 在 堆栈 顶部 实际 上 占用 两 个 位 置 。 

JVM 堆 栈 上 有 多 少 个 位 置 ? 理论 上 ， 因 为 JVM 没 有 硬件 限制 ， 你 需要 多 少 就 有 多 少 。 实 
际 上 ， 你 写 的 每 个 程序 、 方 法 或 函数 都 会 定义 一 个 最 大 堆栈 大 小 。 类 似 地 ， 对 所 需 的 存储 器 
大 小 没有 硬件 定义 的 限制 。 与 此 不 同 ， 每 个 方法 都 定义 了 局 部 变量 的 最 大 数量 ， 这 些 变量 不 
是 存储 在 堆栈 上 ， 而 是 用 于 临时 存储 值 。 


2.3.2 一 个 算术 指令 集 示 例 

数据 类 型 : : 

JVM 支 持 8 种 基本 数据 类 型 ， 其 中 多 数 与 JAVA 语 言 本 身 的 基本 数据 类 型 密切 对 应 。 这 些 
类 型 列 在 表 2-1 中 。JVM 还 提供 了 大 多 数 的 标准 算术 操作 ， 包 括 学 生 们 可 能 不 熟悉 的 一 些 操作 。 
为 了 精简 指令 集 ， 做 了 某 些 设计 简化 。 


表 2-1 JVM 的 基本 类 型 及 其 表示 


解释 
32 位 带 符 号 整数 
32 位 IEEE 754 浮 点 数 
64 位 整数 ， 存 储 在 两 个 连续 的 堆栈 位 置 
64 位 IEEE 754 浮 点 数 (如上) 
8 位 带 符 号 整数 
16 位 带 符号 整数 
16 位 无 符号 整数 或 UTF-16 字 符 
Java 对 象 


值得 注意 的 是 这 一 组 类 型 中 没有 布尔 (boolean) 类 型 ， 布 尔 类 型 在 Java 中 但 不 在 JVM 中 。 


证 
者 


类 型 
int 
float 
long 
double 
byte 
short 
char 


Po nm Th 


address 
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布尔 变量 当然 只 能 存 有 南 或 假 值 ， 并 可 用 单个 位 来 实现 。 然 而 ， 在 大 多 数 计算 机 中 ， 访 问 单 
个 位 要 比 访 问 一 个 字 低 效 得 多 。 为 此 ， 在 JVM 中 ， 布 尔 值 简单 地 表示 成 字 大 小 (32 位) 的 0 或 
1， 也 就 是 整数 。 

小 于 字 的 存储 类 型 ， 如 字 节 、 短 整数 及 字符 ， 相 当 于 次 级 类 型 。 由 于 在 JVM 中 做 32 位 数 
学 计算 不 会 比 做 更 小 数 的 数学 计算 用 的 时 间 更 长 ， 故 所 有 这 种 数据 类 型 的 变量 就 自动 在 CPU 
内 提升 为 32 位 整数 。 另 一 方面 ， 这 种 类 型 的 变量 在 存储 时 有 一 个 明显 的 不 同 。 例 如 ， 一 个 1 百 
万 字 节 的 数组 所 占用 的 空间 是 类 似 整 数 数组 的 四 分 之 一 。 由 于 这 个 原因 ，JVM 支 持 小 类 型 
( 字 节 、 短 整数 、 字 符 甚 至 布尔 ) 从 存储 器 中 读 出 或 存 到 存储 器 ， 特 别 是 对 于 数组 的 存 取 。 

基本 算术 操作 
” ”对 于 这 些 需 要 通过 特殊 的 处 理 来 支持 的 数据 类 型 ， 几 乎 每 个 类 型 和 操作 的 组 合 都 需要 一 个 特 
定 的 操作 代码 和 助 记 符 。 为 简化 程序 员 的 任务 ， 多 数 的 助 记 符 都 使 用 字母 码 来 指明 动作 的 类 型 。 例 
如 ， 将 两 个 整数 相 加 的 助 记 符 是 iadd， 将 两 个 长 整数 相 加 就 要 用 1add， 而 要 将 两 个 浮 点 数 和 双 精 度 
数 相 加 就 分 别 用 fadd 和 dadd。 为 简便 ， 这 个 系列 简写 成 ?add， 其 中 ?代表 任何 合法 的 类 型 字母 。 

基本 的 算术 操作 加 (?add)、 减 (?sub)、 乘 (?mu1)、 除 (?div)， 对 4 种 主要 的 类 型 
(整数 、 长 整数 、 浮 点 数 及 双 精 度数 ) 都 进行 了 定义 。 所 有 这 些 操作 都 是 通过 从 堆栈 位 置 弹出 
前 两 个 “元 素 ”( 注 意 ， 对 于 长 整数 或 双 精 度数 的 操作 ， 前 两 个 “元 素 ” 的 每 个 元 素 都 涉及 两 
个 堆栈 位 置 ， 因 此 总 共 就 要 四 个 堆栈 位 置 )， 计 算 结 果 ， 然 后 将 结果 压 回 到 堆栈 顶部 。 此 外 ， 
JVM 提 供 ?neg 操 作 ， 其 功能 是 对 堆栈 顶部 项 的 符号 取 反 。 这 当然 也 可 以 通过 将 值 一 1 压 入 堆栈 
然后 执行 一 个 乘法 指令 来 实现 ， 但 对 于 这 个 常见 的 动作 ， 用 一 个 专用 的 操作 会 执行 得 更 快 。 

?div 操 作 有 一 个 方面 需要 引起 特殊 注意 。idiv 和 1div 都 需要 对 整数 操作 并 产生 整数 作为 
结果 (没有 分 数 或 小 数 )。 例 如 ，8 除 以 5 产生 结果 1， 而 不 是 浮 点 数 1.6。 要 执行 一 个 浮 点 除法 ， 
就 有 必要 先 将 两 个 参数 转换 成 浮 点 或 双 精 度 类 型 ， 这 在 后 面 将 要 讨论 。 类 似 地 ， 对 整数 和 长 
整数 类 型 有 一 个 特殊 的 操作 ?rem， 其 功能 是 取 余 数 或 模 (modulus)。 这 个 操作 对 于 浮 点 / 双 精 
度 类 型 不 存在 ， 因 为 除法 操作 要 执行 的 是 精确 的 除 ， 就 是 说 要 精确 到 机 器 表示 所 允许 的 程度 。 

逻辑 操作 

JVM 只 为 整数 和 长 整数 类 型 提供 了 基本 的 逻辑 操作 : 与 (?and)、 或 (?or) 及 异 或 
(?xor) ( 见 图 2-5 和 图 2-6) 。 这 些 操作 以 按 位 (bitwise) 的 形式 进行 ， 意 思 是 第 一 个 操作 数 的 
每 个 位 都 独立 地 与 第 二 个 操作 数 的 相应 位 进行 操作 ， 结 果 就 是 各 个 独立 位 操作 结果 的 总 和 。 
当 应 用 到 布尔 值 时 ，0 与 /或 1， 结 果 正 如 所 料 。0 的 表示 是 0x0000，1 的 表示 是 0x0001。 对 于 除 
了 最 后 一 位 的 位 置 ， 相 应 的 位 是 0 和 0， 对 于 最 后 一 个 位 置 ， 相 应 的 位 就 是 0 和 1。 值 0x0000 与 
0x0001 进 行 OR 操 作 就 等 于 0x0001。 换 名 话说 ， 假 OR 真 是 页 ， 正 如 预期 。 





图 2-6 按 位 XOR 操 作 示 意图 
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移 位 操作 

除了 这 些 熟 悉 的 操作 外 ，JVM 还 为 改变 位 模式 尤其 是 在 数 中 移动 位 而 提供 了 一 些 标准 的 
移 位 (shift) 操作 。 在 Java/C/C++ 中 ， 这 些 都 表示 成 << 或 者 >> 操 作 符 。 基 本 的 操作 就 是 将 数 
中 的 每 一 位 向 右 或 向 左 移动 一 个 位 置 。 以 二 进 制 模式 0xBEEF 为 例 ; 

B E E F 

1011 1110 1110 1111 


0111 1101 1101 1110 
0101 1111 O111 0111 


becomes 
左 移 一 位 
右 移 一 位 


这 样 ，0xBEEF 左 移 一 位 就 成 为 0x7AAE， 右 移 一 位 就 成 为 0x5F77。 在 两 种 情况 下 ， 右 边 
或 左边 留 下 的 空位 都 用 0 来 填充 。 这 种 移 位 称 为 逻辑 移 位 (logical shift) ， 与 算术 移 位 
(arithmetic shift) 相对 应 。 算 术 移 位 试图 保留 数 的 符号 ， 所 以 在 算术 右 移 时 ， 要 不 断 地 复制 
符号 位 填充 在 空位 上 。 (算术 左 移 无 需 复制 最 右边 的 位 ) 。 








B E E F 

1011 1110 1110 11ll | becomes 
0101 1111 .0111 0111 | 逻辑 右 移 
1101 1111 0111 0111 | 算术 右 移 


特别 对 于 有 符号 数 的 情况 ,逻辑 右 移 的 结果 总 是 正 数 ， 因 为 0 被 插入 到 了 最 左边 的 符号 位 。 
相 比 之 下 ， 当 且 仅 当 原 始 值 是 负数 时 ， 算 术 右 移 的 结果 总 是 负数 ， 因 为 在 操作 时 符号 位 被 复 
制 。 对 于 无 符号 数 ， 左 移 等 价 于 将 该 数 乘 以 2 的 某 次 等 ， 而 逻辑 右 移 等 价 于 将 该 数 除 以 2 的 某 
次 赛 。 一 般 来 说 ， 这 些 操作 用 于 将 一 组 已 知 的 位 放置 于 模式 中 的 特定 位 置 上 ， 例 如 用 来 作为 
将 要 进行 的 按 位 AND、OR、XOR 操 作 的 一 个 操作 数 。JVM 为 执行 这 些 移 位 提供 三 种 操 
作 : ?sh1 ( 左 移 )、?shr (算术 右 移 ) 、 及 ?ushr (逻辑 右 移 ， 这 个 助 记 符 实际 上 表示 “无 符 
号 右 移 ") ， 这 些 操作 对 整数 (32 位 模式 ) 和 长 整数 (64 位 模式 ) 都 适用 。 

转换 操作 

除了 这 些 基本 的 算术 和 届 辑 操作 ， 还 有 一 些 形式 如 ?23? 的 一 元 转换 操作 。 例 如 ，i2f 就 是 
将 一 个 整数 (1) 转换 成 一 个 浮 点 数 〈(f)。 一 般 来 说 ， 每 个 这 种 操作 都 是 弹出 堆栈 顶端 的 元 素 ， 
将 其 转换 成 合适 的 新 类 型 ， 并 将 结果 压 人 堆栈 。 这 通常 不 会 改变 堆栈 的 总 体 大 小 ， 除 非 转换 
是 从 长 类 型 到 短 类 型 (或 相反 )。 例 如 ， 操 作 1i21 将 从 堆栈 弹出 一 个 字 (32 位 ) ， 将 其 转换 成 64 
位 (2 个 字 ) ， 然 后 将 两 个 字 的 数 压 人 堆栈 ， 占 两 个 元 素 。 所 产生 的 效果 就 是 使 堆栈 的 深度 增 
加 1， 类 似 地 ，d2i 操 作 会 将 堆栈 深度 减 小 1。 

如 前 所 述 ， 因 为 效率 的 原因 ， 不 是 所 有 的 类 型 组 合 都 为 JVM 所 支持 。 一 般 来 说 ， 转 换 到 
整数 或 从 整数 转换 到 其 他 类 型 的 数 总 是 可 以 的 。 在 四 种 基本 类 型 整数 、 长 整数 、 浮 点 数 、 双 
精度 数 之 间 进 行 转 换 也 总 是 可 以 的 。 然 而 ， 从 一 个 字符 就 不 能 通过 一 次 操作 直接 转换 到 一 个 
浮 点 数 ， 反 过 来 也 不 行 。 这 有 两 个 主要 原因 。 首 先 ， 由 于 小 于 字 (sub-word) 的 类 型 自动 地 
转换 成 字 类 型 ， 所 以 这 个 本 来 要 定义 成 b2i 的 操作 在 某 种 意义 上 说 是 自动 进行 ， 甚 至 是 不 可 避 
免 的 。 其 次 ， 如 前 所 述 ， 将 整数 转换 成 浮 点 数 (例如 ，2<>2.0) 不 仅 涉及 从 更 大 的 整体 中 选 
择 特定 的 位 ， 还 采用 了 完全 不 同 的 表示 系统 ， 并 改变 了 表示 的 基本 模式 。 如 果 需 要 在 一 个 浮 
点 数 和 一 个 字符 之 间 进 行 转换 ， 就 可 通过 两 个 步 又 来 完成 (f21，i2c)。 由 于 类 似 的 原因 ， 三 
种 操作 1i2s、i2c、i2b 的 输出 有 些 不 寻常 。 操 作 结 果 不 是 生成 (并 压 人 ) 助 记 符 中 的 第 二 个 类 
型 的 数 ， 而 是 生成 一 个 整数 。 然 而 ， 生 成 的 整数 将 被 截断 成 适当 的 大 小 和 范围 。 这 样 ， 在 
0x24581357 上 执行 i2b 操 作 就 会 产生 模式 0x00000057， 等 价 于 单字 节 0x57。 
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2.3.3 堆栈 操作 

无 类 型 堆栈 操作 

除了 这 些 特定 类 型 的 操作 ，JVM 还 为 日 常 堆栈 处 理 提供 了 一 些 通 用 和 无 类 型 的 操作 。 一 
个 简单 和 明显 的 例子 就 是 pop 操 作 ， 其 功能 是 从 堆栈 弹出 单个 字 。 由 于 这 个 值 就 要 被 丢弃 ， 所 
以 它 是 一 个 整数 、 一 个 浮 点 数 、 一 个 字 节 或 者 其 他 类 型 都 不 要 紧 。 类 似 地 ，pop2 要 从 堆栈 移 
除 两 个 字 ， 或 者 就 是 一 个 双 字 的 条 目 、 或 者 是 一 个 长 整数 、 或 者 是 一 个 双 精 度数 。 这 种 类 型 
的 类 似 操作 还 包括 dup， 其 功能 是 在 堆栈 顶端 复制 并 压 入 单个 字 的 条 目 。dup2 则 是 复制 和 压 入 
一 个 双 字 的 条 目 。swap 的 功能 是 交换 堆栈 顶端 的 两 个 字 。nop 是 “无 操作 ”的 缩写 ， 它 不 做 任 
何事 情 〈 但 要 占用 时 间 ， 所 以 在 需要 使 机 器 等 待 一 微 秒 左右 时 间 时 可 用 这 条 指令 ) 。 

此 外 ， 还 有 一 些 不 常用 的 操作 ， 用 来 执行 相当 特殊 的 堆栈 操作 。 比 如 dup_x1， 其 功能 是 复 
制 堆 楼 项 端的 字 然 后 将 其 插入 到 第 二 个 字 的 下 面 。 如 果 堆 栈 自 顶 向 下 保存 的 值 是 (5 3 4 6) ， 则 
执行 dup_X1 就 会 产生 (535 4 6)。 这 些 特殊 的 操作 见 附录 B， 在 本 书 中 就 不 做 进一步 讨论 了 。 

常数 和 堆栈 

当然 ， 为 进行 这 些 基 于 堆栈 的 计算 ， 就 需要 用 一 些 方法 首先 将 数据 置 于 ( 压 人 ) 到 堆栈 
上 。 根 据 要 压 和 的 数据 类 型 以 及 该 数据 来 自 于 哪里 ，JVM 有 若干 个 这 种 方法 。 

最 简单 的 情况 是 将 一 个 常数 压 人 到 堆栈 。 根 据 该 常数 的 大 小 不 同 ， 你 可 以 使 用 bipush 指 
令 《〈《 压 人 一 个 字 节 的 带 符号 整数 )、sipush 指 令 (2 字 节 带 符号 整数 )、1dc 指 令 (一 个 单字 的 
常数 ， 如 一 个 整数 、 一 个 浮 点 数 或 一 个 地 址 ) 、 或 者 1dc2_w 指 令 (一 个 双 字 的 常数 ， 如 一 个 长 
整数 或 一 个 双 精 度数 ) 。 所 以 ， 将 整数 3 和 5 压 人 到 堆栈 ， 然 后 将 它们 相 乘 的 代码 就 如 下 所 示 : 


bipush 5 

bipush 3 

imul 

其 变型 : 

sipush 5 1dc 5 
sipush 3 ldc 3 
imu] imul 


能 完成 同样 的 事情 ， 但 效率 比较 低 。 因 为 5 和 3 很 小 ， 可 以 装 入 到 单个 字 节 中 并 用 bipush 
指令 压 人 。 而 且 还 要 注意 ， 因 为 乘法 是 可 交换 因数 位 置 的 ， 所 以 你 先 压 人 5 还 是 先 压 入 3 没有 
关系 。 减 法 和 除法 就 不 是 这 种 情况 ， 在 这 两 种 操作 中 ， 计 算 机 从 先 压 入 的 数 中 减 去 后 压 入 的 
数 ， 或 者 将 先 压 入 的 数 除 以 后 压 入 的 数 。 所 以 ， 在 上 面 例子 中 ， 用 idiv 取 代 imu1 将 导致 5 除 以 
3， 在 堆栈 上 产生 结果 1 (不 是 1.66667， 因 为 idiv 规 定 的 是 整数 除 ， 小 数 部 分 被 舍 掉 )。 

为 了 提高 效率 ， 有 若干 种 专用 操作 能 将 常用 的 常数 以 更 快 的 速度 压 人 到 堆栈 。 例 如 ， 
iconst_N， 其 中 N 是 1、2、3、4、5 之 一 ， 就 能 将 一 个 字 的 整数 压 人 到 堆栈 上 。 由 于 常常 有 必 
要 将 一 个 变量 初始 化 成 1 或 者 将 一 个 变量 加 1，iconst_1 要 上 比 实现 同样 功能 的 bipush 1 要 快 。 
这 样 ， 我 们 就 可 将 上 面 例子 重 写 成 如 下 代码 使 其 运行 得 稍微 地 快 一 些 ， 


iconst_5 
iconst_3 
jimul 


类 似 地 ，iconst_ml 将 整数 值 -1 压 入 。 等 价 的 快捷 表示 还 有 针对 浮 点 数 的 (fconst_N 对 
于 0、1、2)、 长 整数 的 〈1const_N 对 于 0、1)、 以 及 双 精 度数 的 (dconst_N 对 于 0、1) 。 

局 部 变量 

除了 装 入 常数 ， 还 可 以 从 存储 器 装 入 值 。 每 个 JVM 方 法 都 有 一 组 可 自由 随机 并 以 任何 顺序 
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访问 的 存储 器 位 置 与 其 关联 。 像 堆栈 一 样 ， 可 得 到 的 存储 器 位 置 不 受 硬件 的 限制 ， 可 由 程序 员 
设 定 。 而 且 ， 如 前 所 述 ， 装 和 人 的 模式 类 型 决定 了 操作 及 助 记 符 。 要 装 入 一 个 整数 ， 就 用 i1oad; 
要 装 入 一 个 浮 点 数 ， 就 用 f1oad。 各 操作 都 能 够 取得 适合 的 变量 并 将 其 值 压 人 到 堆栈 顶部 。 

变量 利用 顺序 的 数字 来 引用 ， 从 0 开始 。 所 以 ， 如 果 一 个 给 定 的 方法 有 25 个 变量 ， 就 有 0 
到 24 的 数字 。 每 个 变量 存储 了 一 个 标准 的 字 大 小 的 模式 ， 所 以 变量 没有 类 型 。 双 字模 式 (长 
字 或 双 精 度 字 ) 的 存储 就 稍微 更 复杂 一 些 ， 因 为 每 个 模式 必须 占用 两 个 相 邻 的 变量 。 例 如 ， 
从 变量 4 装 和 人 一 个 双 精 度数 ， 实 际 上 是 从 两 个 变量 4 和 5 读 取 值 。 此 外 ，JVM 还 允许 若干 种 
像 ?10ad_N 这 样 的 快捷 方式 ， 所 以 用 i1oad 0 或 者 快捷 方式 ?load_0 都 能 从 局 部 变量 0 (#0) 装 
和 人 一 个 整数 值 。 对 于 所 有 4 种 基本 类 型 、 从 0 到 3 的 所 有 变量 都 存在 这 个 快捷 方式 。 

类 似 地 ， 数 据 可 从 堆栈 弹出 ， 并 存储 在 局 部 变量 中 以 备 后 用 。 这 种 情况 采用 的 指令 
是 ?store， 其 中 首 字符 仍 是 存储 类 型 。 如 前 所 述 ， 存 储 一 个 长 整数 或 双 精 度数 实际 上 要 执行 
两 次 弹出 操作 ， 并 将 结果 存储 在 两 个 相 邻 的 变量 中 。 所 以 ， 指 令 dstore 3 要 从 堆栈 中 移出 两 
个 元 素 而 不 是 一 个 ， 并 改变 两 个 局 部 变量 #3 和 #4。 同 样 ， 如 前 所 述 ， 对 所 有 类 型 并 且 N 从 0 到 
3 变化 时 都 存在 形 如 ?store_N 的 快捷 方式 。 


2.3.4 汇编 语言 和 机 器 码 

让 我 们 看 一 个 简单 的 代码 片断 来 了 解 各 种 转换 如 何 发 生 。 我 们 将 从 单条 简单 的 高 级 语言 
语句 开始 〈 如 果 “ 简 单 高 级 语言 语句 ”在 术语 上 没有 了 矛盾 ): 

Xx=1+2+3+4+5; 

这 条 语句 (很 清楚 吧 ? ) 要 计算 常数 1 到 5 的 和 并 存 人 局 部 变量 x。 首 先 的 问题 是 JVM 不 理 
解 命 名 局 部 变量 的 思想 ， 只 理解 编号 的 变量 。 编 译 器 需要 识别 出 x 是 一 个 变量 ， 并 为 其 分 配 相 
应 的 编号 (假设 使 用 #1 并 且 它 是 一 个 整数 )。 执 行 这 个 任务 所 需要 编写 的 一 种 代码 (还 有 很 多 
其 他 写法 ) 就 是 如 图 2-7 所 示 的 操作 序列 。 


;X=1+2+3+4+5; 

; 转换 成 : 1 2 + 3 + 4 + 5 +， 然 后 装 入 到 可 
iconst_1 装 入 常数 值 1 

iconst_2 装 入 常数 值 2 

iadd 做 加 法 

iconst_3 装 入 常数 值 3 


iadd 做 加 法 
iconst_4 装 人 常数 值 4 
iadd 做 加 法 
iconst_5 装 入 常数 值 5 
iadd 做 加 法 
istore_l1 存 到 Xx 





图 2-7 jsmin 程 序 片 断 #1 


这 是 编译 器 的 主要 任务 ， 就 是 将 高 级 语句 转换 为 若干 个 基本 操作 。 到 此 ， 汇 编 器 (或 者 
编译 器 的 一 个 不 同 部 分 ) 的 任务 就 是 将 每 个 操作 助 记 符 转换 为 相应 的 机 器 码 字 节 。 全 部 的 对 
应 关系 在 附录 B 和 C 中 给 出 。 我 们 注意 到 该 程序 用 到 的 iadd 对 应 于 机 器 指令 0x60。 转 换 全 部 程 
序 就 产生 表 2-2 所 列 出 的 结果 。 

这 样 ， 相 应 的 机 器 码 就 是 字 节 序列 0x04、0x05、0x60、0x06、0x60、0x07、0x60、0x08、 
0x60、0x3c， 这 些 将 被 存储 到 磁盘 上 作为 可 执行 程序 的 一 部 分 。 

转换 并 不 总 是 这 人 么 简单 ， 因 为 一 些 操作 要 占用 多 个 字 节 。 例 如 ，bipush 指 令 将 一 个 字 节 
压 人 到 堆栈 上 (就 像 1iconst_0 将 0 压 和 人 到 堆栈 上 一 样 ) 。 但 是 ， 是 哪个 字 节 呢 ? bipush 指 令 本 
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身 具 有 值 0510， 但 它 后 面 总 是 跟 一 个 字 节 ， 表 明 需 要 压 入 的 是 什么 。 要 压 人 值 0， 编 译 器 也 可 
用 bipush 0， 这 将 被 汇编 成 两 个 连续 的 字 节 ，0x10、0x00。 这 样 ， 我 们 就 有 了 该 程序 的 另 一 
种 版 本 ， 如 表 2-3 所 示 。 注 意 ， 这 第 二 个 版 本 大 约 要 加 长 50% ， 因 此 更 低 效 。 


表 2-2 将 程序 片断 #1 转换 成 字 节 码 












iconst_1 0x04 iconst_ 4 

iconst 2 Ox05 iadd 0x60 
iadd 0x60 iconst_5 Ox08 
iconst_ 3 0x06 iadd Ox60 
iadd Ox60 iconst_1 Ox3c 





表 2-3 将 程序 片断 #2 转换 成 字 节 码 








修改 的 助 记 符 
bipushl 


修改 的 助 记 符 
bipush4 








Ox01 Ox04 


bipush2 Ox10 iadd 0x60 
Ox02 bipush5 Ox10 
iadd Ox60 Ox05 
bipush3 Ox10 iadd 0x60 
0x03 istore_1 Ox3c 


iadd 






2.3.5 非法 操作 

因为 堆栈 和 局 部 变量 都 只 存储 位 模式 ,程序 员 可 能 很 容易 弄 混 。 这 尤其 可 能 发 生 在 压 入 
常数 时 ， 因 为 常数 的 类 型 不 是 明确 地 标记 在 助 记 符 中 。 将 整数 值 10 置 于 堆栈 的 命令 是 1dc 10， 
将 浮 点 值 10.0 置 于 堆栈 的 命令 是 ldc 10.0。 由 于 大 多 数 JVM 汇 编 器 足够 聪明 ， 能 够 区 分 出 10 是 
一 个 整数 而 10.0 是 一 个 浮 点 数 ， 所 以 在 两 种 情况 下 都 能 将 正确 的 位 模式 压 和 人 到 堆栈 。 然 而 ， 
这 些 位 模式 是 不 一 样 的 。 试 图 压 入 两 次 10.0 然 后 执行 一 个 imu] 指 令 将 不 会 得 到 100.0 (或 者 其 
至 100)。 试 图 将 浮 点 数 当成 整数 执行 一 个 算术 运算 ， 或 者 将 整数 当成 浮 点 数 执行 一 个 算术 运 
算 都 是 错误 的 。 在 最 好 的 情况 下 ， 机 器 会 给 出 警告 。 在 最 坏 的 情况 下 ， 机 器 其 至 不 理会 ， 并 
给 出 完全 错误 的 答案 ,而 且 这 种 错误 是 神秘 而 不 可 追踪 的 。 

同样 ， 企 图 将 双 字 变量 、 长 整数 或 双 精 度数 当成 单字 变量 来 访问 其 上 半 部 分 (或 下 半 部 分 ) 
也 是 错误 的 。 如 果 你 已 经 将 一 个 双 精 度数 存储 到 局 部 变量 #4 (及 略 )， 就 不 能 从 局 部 变量 #5 (#4) 
装 入 一 个 整数 。 最 好 情况 下 机 器 仍然 会 给 出 警告 ， 最 坏 情 况 是 默默 地 给 出 无 意义 而 且 极 其 错误 
的 结果 。 试 图 从 空 堆栈 弹出 、 从 不 存在 的 变量 装 人 或 存 人 不 存在 的 变量 等 等 也 是 错误 的 。 

JVM 的 主要 优势 之 一 就 是 其 设计 (第 三 章 将 会 讨论 ) 能 够 在 这 类 错误 发 生 时 ， 甚 至 在 写 
程序 时 就 捕获 它们 ， 使 得 程序 员 得 以 摆脱 错误 。 这 就 极 大 地 提高 了 JVM 程 序 的 安全 性 和 可 靠 
性 。 然 而 ， 一 个 好 的 程序 员 不 应 该 依赖 计算 机 的 能 力 来 捕捉 错误 。 精 心地 规划 和 遵 慎 地 编写 
代码 是 确保 计算 机 得 出 正确 结果 的 更 好 方式 。 


2.4 一 个 样 例 程 序 
2.4.1 一 个 有 注解 的 例子 

回 到 本 章 开头 的 圆锥 体 问题 ， 现 在 问题 就 变 成 我 们 不 仅 想 知道 问题 的 答案 ， 而 且 还 要 知 
道 如 何在 所 讨论 的 机 器 (JVM) 上 实现 。 简 要 回顾 一 下 ， 原 问题 是 : 
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一 个 底面 直径 450 米 ， 高 150 米 的 锥 形 山 的 体积 是 多 少 ( 见 图 2-8) ? 这 个 公式 在 黑板 上 可 
以 写作 : 
工 .| .1450Y |. 
3 | WU ) | 150 
用 什么 JVM 指 令 序 列 能 解决 这 个 问题 呢 ? 
首先 ,我们 需要 计算 浮 点 值 1/3。 整 数 除 不 行 ， 因 为 
1/3 等 于 0， 而 1.0/3 等 于 0.333333。 这 样 ， 我 们 将 两 个 元 
素 1.0 和 3.0 压 入 并 执行 一 个 除法 : 450m 


图 2-8 一 个 锥 形 山 


150 m 


0.33 


ldc 1.0 
1dc 3.0 
fdiv 


fdiv 之 后 


然后 压 入 已 知 的 x 值 。 


1dc 3.141593 


_ 
[~ 
中 
E 0» 
【= 
N 
讯 


1dc 3.141593 之 后 
要 计算 半径 ， 我 们 只 要 压 信 450， 压 人 2， 然 后 再 做 除法 。 注 意 450 过 大 ， 不 能 存储 在 单个 
字 节 中 (单字 节 最 大 也 只 能 到 整数 值 127) ， 所 以 必须 用 sipush。 
| 
EE 
sipush 450 
bipush 2 、 


bipush 2 之 后 





450 
要 对 半径 求 平方 ， 我 们 可 以 重新 计算 -> ， 或 者 也 可 更 高 效 地 采用 dup 指 令 措 贝 堆 栈 顶 
部 元 素 并 执行 乘法 。 


dup 3.141593 


imul 3 


bed 
by 
be 





dup 之 后 imu] 之 后 
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下 面 ， 将 高 度 150 再 压 人 并 做 乘法 。 









1 
sipush 150 EEE | 
sipush 150 之 后 imul 之 后 


堆栈 顶部 的 整数 值 必须 转换 成 浮 点 数 ， 然 后 两 个 ( 浮 点 ) 乘法 就 计算 出 最 终 答案 并 将 其 
置 于 堆栈 顶部 。 






7593750.0 
3.141593 









i2f 033 
fu1 | 
fmu] 


j2f 之 后 


这 个 过 程 将 被 存储 成 一 个 机 器 码 指令 序列 。 每 个 指令 将 分 别 从 存储 器 中 取出 并 执行 。 由 
于 语句 是 顺序 的 ， 下 一 条 要 取出 的 指令 就 是 指令 序列 的 下 一 条 指令 ,这样 ， 这 个 复杂 的 语句 
序列 就 会 按期 望 的 那样 工作 。 在 指令 集 可 利用 的 基本 操作 范围 内 ， 可 以 用 类 似 的 过 程 完成 任 
何 计算 。 


2.4.2 最 终 的 JVM 代 码 


; 计算 1/3 
1dc 1.0 
ldc 3.0 
fdiv 


; 压 入 pi 
1dc 3.141593 


; 计算 半径 
sipush 450 
bipush 2 
idiv 


; 压 人 高 度 
sipush 150 


5 将 高 度 与 半径 的 平方 相 乘 


imul] 


;转换 成 浮 点 数 


12f 


;再 乘 以 以 前 计算 出 的 x 和 1/3 
fmul 
fmu]l 
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2.5 JVM 计 算 指令 总 结 
算术 操作 : 


假想 计算机 


整数 长 整数 浮 点 数 双 精 度数 短 整数 字符 字 节 
加 法 iadd 1add fadd dadd 
.， 减法 isub lsub fsub dsub 
乘法 imul 1mul fmul dmul 
除法 idiv ldiv fdiv ddiv 
求 余数 irem lrem 
取 反 ineg lineg fneg dneg 
逻辑 (布尔) 操作 ， 
整数 长 整数 
逻辑 AND iand land 
逻辑 OR ior lor 
丈 辑 XOR ixor 1xor 
移 位 操作 : 
左 移 (算术 ) 
整数 长 整数 
ishl 1shl 
右 移 (算术 ) 
ishr 1shr 
右 移 (逻辑) 
iushr lushr 
转换 操作 ， 
从 : 到 : 
整数 长 整数 浮 点 数 双 精 度数 短 整 数 字符 字 节 
整数 i21 i2f i2d i2s i2¢c i2b 
长 整数 12i 12f 12d 
浮 点 数 f2i f21 f2d 
双 精 度数 d2i d21 d2f 
(将 短 整数 、 字 符 及 字 节 转换 到 整数 是 隐 含 和 自动 的 ) 
2.6 本 章 回顾 


。 计 算 机 与 计算 器 一 样 ， 只 能 做 其 硬件 所 允许 的 一 些 动作 。 对 于 不 能 用 单个 操作 或 按钮 点 
击 完成 的 复杂 计算 ， 就 必须 用 若干 个 可 允许 的 基本 步骤 组 成 的 序列 来 完成 。 

。 传 统 的 数学 ， 如 写 在 黑板 上 的 数学 计算 公式 ， 采 用 的 是 中 绥 表 示 ， 其 中 像 除 法 这 样 的 操 
作 符 写 在 两 个 参数 之 间 。 而 一 些 计 算 器 或 计算 机 (JVM 就 是 其 中 之 一 )， 采 用 的 是 后 缀 
表示 ， 操 作 符 放 在 参数 之 后 。 

。 后 组 表示 可 容易 地 用 称 为 堆栈 的 数据 结构 描述 和 模拟 。 

。 任 何 计算 机 的 基本 操作 都 是 取 指 一 执行 循环 ， 在 此 过 程 中 ， 指 令 被 从 主 存储 器 中 取出 、 
解释 并 执行 。 这 个 循环 的 重复 次 数 没 有 限制 。 

。CPU 拥 有 为 进行 取 指 一 执行 周期 所 需要 的 两 个 重要 信息 : 指令 寄存 器 (IR) 保存 的 是 当 
前 正在 执行 的 指令 ， 程 序 计数 器 (PC) 保存 的 是 下 一 条 要 取出 指令 的 地 址 。 

。 计 算 机 有 两 个 基本 的 设计 思想 :复杂 指令 集 计算 (CISC) 和 精简 指令 集 计 算 (RISC)。 
Intel 奔腾 和 苹果 /IBM/Motorola Power 体 系 结构 分 别 是 体现 这 两 种 思想 的 典型 实例 。 
。JVM 采 用 有 类 型 基于 堆栈 的 计算 来 执行 大 多 数 的 算术 操作 。 助 记 符 描述 了 要 执行 的 操作 
以 及 所 使 用 的 数据 类 型 。 在 错误 类 型 的 数据 上 执行 一 个 操作 将 会 产生 错误 。 
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。JVM 还 对 经 常 使 用 的 操作 提供 了 一 些 快捷 操作 ， 比 如 将 值 0 装 入 到 堆栈 。 
。 简 单 的 基本 数学 操作 序列 能 执行 非常 复杂 的 计算 。 


2.7 习题 


1. 在 计算 器 上 有 一 个 [wz] 按 钮 有 什么 优点 ? 有 什么 缺点 ? 
2. 在 一 个 标准 的 (中 缀 表示 ) 计算 器 上 ， 用 什么 样 的 操作 序列 来 计算 (7+1) : (8 一 3)? 在 一 个 
RPN 后 组 计算 器 上 怎么 做 呢 ? 
.是 否 存在 相应 的 采用 前 组 表示 的 操作 序列 来 执行 上 述 计算 ? 如 果 有 ， 是 什么 ”如 果 没 有 ， 
为 什么 ? 
取 指 一 执行 周期 在 CISC 或 RISC 计 算 机 上 哪 一 个 运行 更 复杂 一 些 ? 为 什么 ? 
有 类 型 计算 与 无 类 型 计算 之 间 的 差别 是 什么 ? 分 别 给 出 两 个 例子 。 
有 类 型 算术 运算 的 优点 和 缺点 各 是 什么 ? 
为 什么 不 存在 cadd 指 令 ? 
-下面 的 指令 哪些 是 非法 的 ? 为 什么 ? 
e bipush 7 
e bipush -7 
es sipush 7 
@ ldc -7 
@ ldc2 -7 
e bipush 200 
e@e ldc 3.5 
e Sipush -300 
e Sipush -300.0 
© idc 42.15 


. 怎样 用 移 位 操作 将 一 个 整数 乘 以 8? 

10. 描述 两 种 方式 将 一 个 64 位 长 的 整数 中 的 最 低 8 位 提取 出 来 。 

11. 存在 能 在 整数 和 浮 点 数 上 都 能 运行 的 操作 吗 ? 整数 和 长 整数 呢 ? 

12. 在 ?div 指 令 中 ， 被 除数 是 存储 在 堆栈 顶端 还 是 从 顶端 开始 的 第 二 个 元 素 ? 

13. 球 表面 的 面积 是 相同 半径 的 圆 面积 的 4 倍 。 写 出 一 个 后 缀 表达 式 来 计算 半径 为 R 的 半球 贺 顶 
的 表面 面积 。 

14. 写 出 一 个 后 组 表达 式 来 计算 a、b、c、d 及 6 五 个 数 的 算术 平均 值 。 

15. 证 明 对 任意 的 中 级 表达 式 都 存在 等 价 的 后 组 表达 式 。 反 之 亦 然 。 


2.8 编程 习题 


. 写 一 个 程序 ， 实 现 功能 ; 解释 一 个 后 缀 表达 式 并 输出 结果 值 。 

写 一 个 程序 ， 实 现 功 能 : 读 入 一 个 中 缀 表达 式 并 写 出 与 其 等 价 的 后 组 表达 式 。 

. 写 一 个 程序 ， 实 现 功能 : 读 人 一 个 JVM 指 令 序 列 ， 确 定 执行 该 指令 序列 可 能 导致 的 最 大 堆 
栈 高 度 。 从 空 堆栈 开始 。 

4. 写 一 个 程序 ， 实 现 功能 : 读 和 一 个 JVM 指 令 序列 ， 确 定 其 中 是 否 有 指令 试图 执行 从 空 堆栈 
弹出 的 动作 。( 注 意 ， 这 实际 上 是 真实 系统 的 验证 器 要 完成 的 任务 之 一 ) 。 


Ww 
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II 一 


第 3 章 用 jasmin 进 行 汇编 语言 编程 


3.1 _ Java 编程 系统 


就 像 在 第 1 章 所 讨论 过 的 ， 为 什么 一 个 用 Java 写 的 程序 要 在 JVM 上 运行 ， 或 者 为 什么 一 
个 JVM 程 序 不 能 用 像 C++ 这 样 的 高 级 语言 写成 ， 在 理论 上 都 是 没有 道理 的 。 在 实际 上 ， 两 者 
之 间 存 在 很 强 的 关联 ， 而 且 Java 语 言 的 设计 已 经 强烈 地 影响 了 Java 虚 拟 机 和 针对 机 器 的 汇编 
器 设计 。 

特别 是 ，Java 强 有 力 地 支持 和 鼓励 称 为 面向 对 象 程序 设计 (object-oriented programming， 
OOP) 的 一 种 特定 的 程序 设计 风格 。 顾 名 思 义 ，OOP 是 一 种 关注 于 对 象 的 编程 技术 ， 对 象 就 
是 这 个 世界 上 独立 的 活动 元 素 (或 者 说 是 这 个 世界 的 一 个 模型 ) ， 每 个 对 象 有 其 自身 的 一 组 可 
执行 (或 者 说 可 于 其 上 执行 ) 的 动作 。 对 象 又 可 归 组 成 类 (class)， 类 是 相似 类 型 对 象 的 集合 ， 
可 根据 其 类 型 共享 某 些 特性 。 例 如 ， 在 真实 世界 中 ,“ 汽 车 ”是 一 个 自然 的 类 ， 几 平 很 少 有 例 
外 ， 所 有 的 汽车 都 共享 某 些 特性 : 它们 都 有 方向 盘 、 油 门 、 刹 车 以 及 车 前 灯 。 它 们 也 共享 某 
些 动 作 : 可 通过 转动 方向 盘 将 车 左 转 或 右 转 ， 通 过 踩 条 车 使 车 减 慢 ， 或 者 由 于 油耗 尽 而 使 车 
完全 停 下 。 更 着 重地 说 ， 如 果菜 人 说 他 刚 买 了 一 辆 新 车 ， 你 可 以 假设 这 辆 车 有 方向 盘 、 刹 车 、 
油箱 等 等 。 

Java 是 通过 将 所 有 函数 附 于 类 并 将 所 有 可 执行 程序 代码 存储 成 单独 的 (并 且 可 分 离 的 ) 
“类 文件 ”来 支持 这 种 编程 风格 的 。 这 些 类 文件 与 Linux 的 可 执行 文件 或 者 Windows 的 .EXE 文 
件 有 相当 紧密 的 对 应 关系 ， 区 别 之 处 是 类 文件 无 须 保 证 其 自身 是 功能 完全 的 程序 。 相 反 ， 一 
个 类 文件 只 包含 特定 类 的 操作 所 必需 的 那些 函数 。 如 果 它 还 依赖 于 另 一 种 对 象 的 性 质 和 函数 ， 
则 这 些 性 质 和 函数 就 存储 在 一 个 对 应 于 该 对 象 的 类 中 。 

Java 类 文件 与 典型 可 执行 文件 的 另 一 个 主要 差别 是 Java 类 文件 在 不 同 机 器 类 型 间 是 可 移植 
的 。 故 此 ， 它 不 是 用 宿主 机 的 机 器 语言 编写 的 ， 而 是 用 JVM 的 机 器 语言 编写 。 这 种 代码 称 为 
字 节 码 (bytecode) 以 表明 它 不 依赖 于 任何 特定 的 机 器 。 由 此 ， 在 任何 机 器 上 编译 的 任何 类 文 
件 可 自由 拷贝 到 任何 其 他 的 机 器 上 并 仍 能 运行 。 从 技术 上 说 ，JVM 字 节 码 只 运行 在 JVM 的 一 
个 副本 上 〈 就 像 Windows 可 执行 文件 通常 只 运行 在 一 个 Windows 计 算 机 上 一 样 ) ， 但 通过 软件 ， 
JVM 在 几乎 每 个 硬件 平台 上 都 能 运行 。 

当 一 个 字 节 码 文件 要 执行 时 ， 要 求 计算 机 运行 一 个 特殊 的 程序 将 类 从 磁盘 加 载 (load) 到 
计算 机 的 存储 器 。 此 外 ， 这 时 计算 机 通常 还 执行 其 他 一 些 动作 ， 比 如 加 载 支持 当前 类 的 其 他 
类 ， 验 证 该 类 及 方法 在 结构 上 的 完备 性 和 安全 性 ， 将 静态 和 类 级 别 的 变量 初始 化 为 适当 的 值 。 
幸运 的 是 ， 从 用 户 或 程序 员 的 角度 看 ， 这 些 步 又 都 内 置 于 JVM 的 实现 中 ， 所 以 用 户 不 需要 做 
任何 事情 。 

这 样 ， 运 行 Java 程 序 就 是 3 个 步骤 的 过 程 。 在 编写 完 程序 源码 后 ， 必 须 将 其 编译 或 转换 成 
一 个 类 文件 。 然 后 用 户 必须 创建 一 个 (软件 的 ) JVM 实 例 用 以 执行 字 节 码 。 做 这 件 事 情 不 同 
系统 所 用 的 具体 命令 不 同 。 例 如 ; 在 一 个 典型 的 Linux 系 统 中 ， 执 行 JVM 的 命令 如 下 所 示 : 


java TheClassOfInterest 
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这 个 命令 就 会 去 寻找 名 为 TheC1ass0fInterest.class 的 文件 ， 将 其 装 入 并 进行 验证 和 
初始 化 。 然 后 ， 该 命令 还 将 在 这 个 类 中 寻找 一 个 名 为 main( ) 的 方法 ， 并 试图 调用 这 个 方法 。 
由 于 这 个 原因 ， 任 何 独立 的 Java 应 用 类 必须 包含 一 个 “main” 方法 。 在 很 多 其 他 的 系统 上 
(例如 Windows 和 MacOS)， 只 要 点 击 与 .class 文 件 对 应 的 图 标 就 会 启动 一 个 TVM 并 运行 类 文 
件 。 此 外 ， 菜 些 种 类 文件 可 直接 从 Web 浏 览 器 (如 微软 的 Internet Explorer 或 网 景 Navigator) 
来 运行 。 

但 是 ， 这 些 程序 实际 上 都 不 是 在 运行 Java 程 序 ， 而 只 是 在 运行 JVM 字 节 码 。 有 许多 编译 
器 能 将 高 级 Java 代 码 转换 成 JVM 字 节 码 ， 并 且 并 不 奇怪， 也 有 程序 能 将 不 是 Java 的 语言 转换 成 
JVM 字 节 码 。 这 里 ， 我 们 将 关注 一 种 特定 种 类 的 语言 ， 在 这 种 语言 中 ， 每 条 字 节 码 语 名 唯一 
地 与 程序 源 代 码 的 单条 语句 相关 联 。 如 在 第 1 章 所 讨论 的 那样 ， 这 种 语言 ( 即 源 代码 语句 与 机 
器 指令 之 间 有 1 对 1 的 关系 ) 通常 称 为 汇编 语言 (assembly language) ， 而 将 一 种 语言 转换 成 另 
一 种 语言 的 程序 称 为 汇编 器 (assembler) 。 (对 高 级 语言 进行 相应 转换 的 程序 则 通常 称 为 编译 
器 (compiler)。) 


3.2 使 用 汇编 器 


3.2.1 汇编 器 

正如 所 料 ， 汇 编 语言 与 机 器 代码 之 间 的 转换 是 相当 直截了当 的 。 相应 地 ,程序 本 身 也 相当 
容易 写 。 汇 编 器 的 任务 非常 简单 ， 所 以 对 汇编 器 我 们 通常 有 若干 种 选择 ， 而 且 这 些 选择 之 间 
的 差异 非常 细微 。 Sun 还 没有 为 JVM 确 立 一 个 官方 的 、 标 准 的 汇编 器 ， 所 以 本 书 中 的 例子 程序 
都 是 针对 jasmin 汇 编 器 所 写 的 。 这 个 程序 在 1996 年 由 纽约 大 学 媒体 研究 实验 宝 的 Jon Meyer 和 
Troy Downing 编 写 9 。 程序 可 从 http://jasmin.sourceforge.net 免 费 下 载 ， 并 在 事实 上 已 经 成 为 
针对 JVM 的 汇编 语言 的 标准 格式 。 jasmin 程 序 还 可 以 从 本 书 的 相关 网 站 http:// prenhall. 
com/juola 得 到 。 这 样 ， 首要 的 步骤 就 是 在 你 工作 的 机 器 上 获得 和 安装 jasmin 由 于 “Java 虚 
拟 机 汇编 语言 ”过 于 元 长 难 念 ， 为 简单 起 见 ， 我 们 也 将 这 个 语言 称 为 jasmin。 


3.2.2 运行 一 个 程序 

为 了 执行 图 1-19 中 的 程序 (在 这 里 我 们 将 它 复制 到 图 3-1 中 )， 该 程序 必须 首先 被 输入 成 机 
器 可 读 的 形式 (如 一 个 文本 文件 )。 可 以 使 用 任何 编辑 程序 做 这 件 事情 ， 从 像 Notepad 这 样 的 
简单 编辑 器 到 复杂 而 且 功能 全 面 的 出 版 用 软件 包 都 可 以 。 但 要 记 住 ， 汇编 器 几乎 不 会 处 理 各 
种 奇特 的 格式 和 字体 变化 ， 所 以 要 将 程序 存储 成 纯 文 本 。 根 据 著者 惯例 ， 用 jasmin 写 的 程序 
通常 用 .j 扩 展 名 存储 ， 所 以 上 面 的 程序 就 应 以 jasminExamp1e.j 存 储 到 磁盘 。， 

为 了 运行 这 个 程序 ， 就 必须 遵循 与 执行 Java 程 序 相同 的 步骤 。 在 程序 用 文本 格式 编写 完 
后 ， 首 先 必 须 将 其 从 人 可 读 的 jasmin 语 法 转换 成 JVM 机 器 码 。 其 次 ， 必 须 运 行 JVM (Java 
mn-time engine) 以 使 JVM 码 可 执行 。 首 先 ( 对 于 适当 配置 的 Linux 机 器 )， 只 要 在 适当 的 命令 
提示 符 后 键入 : 


jasmin jasminExample.j 


© Jon Meyer 的 网 站 是 http://www.cybergrain.com/( 在 我 写 这 本 书 期 间 )。 Meyer 和 Downing 还 有 一 本 描述 JVM 和 
jasmin 的 极 好 的 书 (不 幸 绝版 了 ) Meyer, J. & T. Downing. (1997). Java Virtual Michine. Cambridge, 
MA:O’Reilly。 
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; 定义 相关 的 类 文件 为 jasminExample.class 


.Class public jasminExample 


; 定义 jasminExamp1e 为 0bject 的 子 类 
.Super java/lang/Object 









; 创建 对 象 所 需 的 样板 步 又 
.method public <init>()V 
aload_0 








invokespecial java/lang/0bject/<init>OV 
return 
.end method 








‘method public static main( [Ljava/lang/String];)V 


; 对 于 System.0ut 和 字符 串 ， 需 要 两 个 堆栈 元 素 
.limit stack 2 











; 导 找 5ystem.out (一 个 PrintStream 类 型 的 对 象 ) 


; 并 将 其 放 入 堆栈 
getstatic java/lang/System/out Ljava/io/PrintStreanm; 










寻找 要 打印 的 串 (字符 ) 
: 并 将 其 放 入 堆栈 


ldc "This is a sample program." 







; 调用 PrintStream/print1n 方 法 
invokevirtual java/io/PrintStream/println(Ljava/lang/String;)V 






; ， .大功告成 ! 
return 
.end method 





图 3-1 JVM 汇 编 语言 的 样 例 程序 


这 将 执行 汇编 器 〈 就 是 在 该 文件 上 运行 jasmin， 产 生 一 个 名 字 为 jasminExamp1e.c1ass 
的 新 文件 ， 该 文件 包含 了 JVM 可 执行 码 )。 

这 个 .class 文 件 是 Java 运 行 时 系统 的 一 个 标准 部 分 ， 可 用 任何 通常 的 方式 来 运行 。 最 简单 
的 方式 就 是 键入 、 

java jasminExample 

这 将 创建 一 个 TVM 进 程 ， 并 在 这 个 虚拟 机 上 执行 jasminExamp1le .class 文 件 (明确 地 说 
就 是 定义 在 该 文件 中 的 main 方 法 )。 

这 种 或 类 似 的 进程 对 于 大 多 数 机 器 和 本 书 的 所 有 例子 都 能 行 得 通 (当然 那些 故意 含有 错 
误 的 例子 除外 ) 。 


3.2.3 显示 到 控制 台 还 是 显示 到 窗口 

运行 3.2.2 节 描述 的 程序 使 用 了 一 个 相当 老式 和 风格 不 入 流 的 交互 界面 。 大 多 数 现代 的 程 
序 员 倾向 于 使 用 窗口 界面 并 通过 鼠标 点 击 来 与 计算 机 交互 ， 而 不 愿 使 用 命令 行 和 基于 文本 的 
接口 。Java 流 行 的 主要 原因 是 其 为 窗口 化 和 网 络 化 应 用 提供 了 广泛 支持 。 然 而 ， 这 些 应 用 与 
外 部 世界 交互 的 方式 存在 微小 的 差异 。 

Java 的 最 流行 的 一 种 Web 应 用 称 为 applet。 顾名思义 ,这 是 一 种 小 的 、 相 当 轻 量 级 的 应 用 ， 
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是 特别 为 Web 浏 览 器 互 操 作 而 设计 的 ， 因 而 ， 所 有 主要 的 浏览 器 都 支持 那些 结合 了 JVM applet 
的 Web 页 。 图 3-2 显 示 了 一 个 非常 简单 的 Web 页 的 例子 ， 其 中 唯一 的 内 容 就 是 一 个 <APPLET> 标 
志 。 这 个 页 的 效果 是 : 当 它 被 显示 在 一 个 浏览 器 上 时 ， 浏览 器 将 下 载 和 运行 这 个 applet。 运 行 
这 个 applet 的 具体 方法 是 不 同 的 。 浏 览 器 不 是 调用 “main” 方 法 ， 而 是 调用 一 个 “paint” 方 法 
作为 代码 的 起 点 。 此 外 ， 输 出 指令 (比如 print1n) 被 图 形 专用 指令 (比如 drawstring， 该 
指令 不 仅 接受 要 显示 的 串 ， 而 且 还 接受 该 串 显示 在 窗口 中 的 位 置 之 类 的 参数 ) 代替 。 

<HTML> 

<HEAD> <TITLE>A Sample JVM Applet</TITLE> </HEAD> 


<BODY> 
<APPLET code = "jasminAppletExample" width = 300 height = 100> 


</APPLET> 
</BODY> 
</HTML> 





图 3-2 调用 applet 的 Web 页 


applet 编 程 是 一 门 精细 的 艺术 ， 需 要 applet 专 用 函数 的 一 些 知识 。 利 用 这 些 函 数 ， 一 个 熟 
练 的 程序 员 能 创建 精致 的 图 画 ， 或 者 所 需 的 任何 字体 、 大 小 、 形 状 和 方向 的 文本 。 如 图 3-3 所 
示 ， 无 论 是 写成 applet， 还 是 输出 到 窗口 ， 或 者 是 写成 向 控制 台 输出 的 独立 应 用 ，jasmin 程 序 
的 总 体 结 构 不 会 改变 很 多 。 

像 以 前 一 样 ， 程 序 (jasminApp1etExamp1e.j) 将 用 jasmin 程 序 汇编 ， 产 生 一 个 类 文件 ; 

jasmin jasminAppletExample.j 

一 旦 创建 了 类 文件 jasminApp1etExamp1e.c1ass， 只 要 打开 图 3-2 所 示 的 Web 页 就 可 运行 
applet。 这 可 在 任何 Web 浏 览 器 (例如 Internet Explorer 或 者 Netscape) 中 打开 ， 或 者 用 由 Sun 
公司 连同 Java 系 统一 起 提供 的 特殊 程序 如 appletviewer。 利 用 这 种 技术 ，Java (和 jasmin) 
程序 就 可 作为 可 执行 代码 ， 并 由 任何 地 方 机 器 上 的 JVM 所 使 用 。 


3.2.4 使 用 System.out 和 System.in 

当 用 任何 汇编 语言 编程 时 ， 让 计算 机 读 写 数据 属于 最 具 挑 战 性 的 任务 之 一 。 计 算 机 读 写 
问题 与 计算 机 和 LO 外 设 进行 交互 等 更 一 般 的 问题 相关 。 由 于 外 设 类 型 繁多 (从 网 络 读 与 从 键 
盘 读 有 很 大 的 差异 )， 而 且 更 令 人 烦恼 的 是 ， 即 使 给 定 了 外 设 类 型 ， 其 中 的 差异 也 很 大 (你 的 
键盘 有 没有 数字 键 区 ? ) ， 所 以 每 个 设备 就 不 得 不 用 各 自 不 同 的 方法 来 处 理 。 

Java 的 类 系统 稍微 缓和 了 这 个 问题 。 由 于 所 有 的 车 都 有 方向 盘 并 以 相同 方式 工作 ， 所 以 
人 们 可 以 驾驶 不 熟悉 的 车 。 同 样 ，Java 定 义 了 PrintStream 类 ， 该 类 包括 了 名 为 print 和 
prijint1n 的 方法 。JVM 总 是 定义 一 个 特殊 的 PrintStream， 名 为 System.out， 它 附加 于 一 个 默 
认 的 能 打印 的 设备 上 。 

这 就 提供 了 一 个 相对 简单 的 方法 ， 可 以 通过 print 或 printin 来 产生 输出 。 在 图 3-1 的 简单 例 
子 中 已 经 演示 过 打印 String 类 型 ， 还 可 扩展 用 于 打印 该 方法 支持 的 任何 类 型 (要 做 一 些 改 动 ) 。 
这 里 给 出 的 必要 步骤 大 多 没有 做 解释 ， 你 不 必 现 在 就 理解 它们 。 要 全 面 理解 这 些 步 又 ， 就 要 
求 对 JVM 类 型 和 类 系统 以 及 它们 是 如 何 表示 的 等 问题 有 更 深入 的 研究 。 我 们 将 在 第 10 章 再 返 
回来 更 详细 地 讨论 这 个 简单 例子 。 

首先 ，System.out 对 象 必须 从 其 在 系统 中 的 静态 和 不 改变 的 位 置 压 和 信 到 堆栈 。 

getstatic java/1ang/System/out Ljava/io/PrintStream; 


其 次 ， 要 打印 的 数据 必须 采用 第 2 章 介绍 的 常用 方式 装 和 人 到 堆栈 。 
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; 定义 jasminApp1letExamp1e 作 为 Applet 的 子 类 
“class public jasnminAppletExample 
.Super java/applet/Applet 


; 创建 applet 所 需 的 样板 程序 

; 注意 与 前 面 例子 中 0bject 创 建 的 相似 性 

.method public <init>()V 
aload_0 
; 这 不 是 一 个 0bject ， 所 以 我 们 必须 调用 Applet <init> 
invokespecial java/applet/Applet/<init>OV 
return 

‘end method 


， 注意 app1et 开 始 于 paint() 方 法 而 不 是 main() 

; 还 要 注意 有 微妙 差异 的 定义 

-method public paint (Ljava/awt/Graphics;)V 
: 我 们 需要 4 个 堆栈 元 素 
; Graphics 对 象 
; 要 打印 的 串 


; 打印 位 置 的 x 坐标 
; 打印 位 置 的 y 坐 标 
. .11imit stack 4 


; 存储 在 局 部 变量 #1 的 6raphics 对 象 


.limit locals 2 


; 这 个 样板 程序 有 点 不 寻常 ， 因 为 在 applet 中 绘制 文本 要 比 在 System.out 上 难 
! 装 入 4 个 参数 

aload._1 ; 这 是 作为 参数 传递 的 Graphics 对 象 

ldc "This is a sample applet" ; 要 打印 的 串 

bipush 30 ; 打印 该 串 的 坐标 

bipush 50 


; 调用 drawString 方 法 
invokevirtual java/awt/Graphics/drawString(Ljava/lang/String;II)V 


! .大 功 告 成! 
return 
.end method 





图 3-3 jasmin 的 一 个 样 例 applet 


iload_2 ; 作为 整数 装 入 局 部 变量 #2! 
第 三 ， 必 须 调 用 println 方 法 ， 包 括 在 第 二 步 中 压 人 到 堆栈 的 类 型 表示 。 由 于 语句 iload_2 
压 人 了 一 个 整数 ， 因 此 命令 就 是 ， 


invokevirtual java/io/PrintStream/print1n(CI)V; 

如 果 我 们 压 和 的 是 浮 点 数 (可 用 fload._2)， 命令 就 要 修改 成 用 F 替 代 I， 如 下 所 示 : 
invokevirtual java/io/PrintStream/print1n(CF)V; 

要 打印 一 个 字符 串 ， 就 需要 样 例 程序 中 使 用 的 那 种 复杂 的 语句 。 


invokevirtual java/io/PrintStream/printin(Ljava/lang/String;)V; 


如 果 你 觉得 糊涂 ， 先 不 要 担心 。 类 和 类 的 调用 将 在 第 10 章 详细 讨论 。 现 在 这 些 语句 可 看 作 
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一 种 合法 的 样板 或 魔术 。 每 当 你 要 产生 输出 时 ， 只 要 使 用 适当 的 版 本 就 行 了 。 可 以 用 一 组 类 位 
但 更 复杂 的 样板 程序 从 类 似 构 造 的 System. in 对 象 得 到 输入 ， 但 这 个 讨论 将 推迟 到 我 们 对 类 的 
一 般 概念 有 了 更 好 的 理解 后 再 展开 。 现 在 ， 理 解 基 本 语句 在 开发 jasmin 程 序 中 更 为 重要 。 

有 了 最 新 版 本 的 Java (Java 1.5) ， 采 用 新 定义 的 类 如 Scanner 和 Formatter， 以 及 新 的 结构 
化 的 用 于 格式 化 输出 的 printf 方 法 ， 就 可 以 得 到 一 个 全 新 的 进行 控制 台 输 入 和 输出 的 方法 。 
从 底层 汇编 语言 的 角度 看 ， 这 些 都 被 看 作 是 可 调用 的 新 的 函数 /方法 。 它 们 不 会 牵涉 任何 技术 
上 的 根本 改变 。 


3.3 汇编 语言 语句 类 型 


3.3.1 指令 和 注释 

汇编 语言 语句 可 粗略 地 分 成 三 种 类 型 (特别 是 ， 对 于 jasmin 语 名 也 是 这 样 的 ) 。 第 一 种 类 
型 是 指令 (instruction) ， 直 接 对 应 于 计算 机 的 机 器 语言 或 字 节 码 的 指令 。 在 很 多 情况 下 ， 这 
些 是 通过 查找 汇编 器 中 存储 的 表 而 生成 的 。 对 应 于 助 记 符 iconst_0 的 字 节 码 就 是 位 模式 0x03。 
此 外 ， 大 多 数 汇编 器 允许 使 用 注释 ， 程 序 员 能 够 播 入 提示 和 设计 记录 ， 从 而 帮助 他 们 自己 以 
后 能 理解 现在 正在 做 的 事情 。 在 jasmin 的 一 行 中 ， 任 何在 分 号 (，) 以 后 的 部 分 都 是 注释 ， 
所 以 在 图 3-1 的 前 两 行 都 是 注释 。 汇 编 器 忽略 注释 ， 就 像 它们 不 存在 一 样 ， 所 以 在 汇编 过 程 中 
注释 的 内 容 被 跳 过 ， 但 在 源 程 序 中 这 些 内 容 是 可 见 的 (便于 人 阅读 ， 比 如 便于 正在 给 你 的 程 
序 打分 的 教授 来 阅读 )。 

在 众多 汇编 器 中 ，jasmin 程 序 在 允许 程序 员 自由 使 用 编程 格式 方面 有 点 与 众 不 同 。 汇 编 
语言 程序 的 语句 通常 有 一 个 非常 老 套 和 不 灵活 的 格式 ， 比 如 像 下 面 这 样 : 

标号 ， 
助 记 符 参数 ， 注释 

助 记 符 / 参 数组 合 在 前 面 已 经 见 到 ， 比 如 在 像 11oad 2 之 类 语句 中 。 根据 助 记 符 类 型 的 不 同 ， 
可 以 有 任意 数量 的 参数 ， 不 过 零 个 、 一 个 及 两 个 参数 是 最 常见 的 情况 。 标 号 将 在 第 4 章 详细 讨 
论 。 现 在 只 需 指出 它 标记 了 程序 的 一 个 部 分 ， 使 得 你 能 返回 并 重复 执行 一 段 代 码 。 最 后 ， 这 
个 老 套 的 语句 包含 一 个 注释 。 从 技术 上 说 ， 计 算 机 永远 不 会 要 求 你 对 程序 加 注释 。 另 一 方面 ， 
你 的 老师 几乎 总 会 要 求 你 加 注释 ， 而 好 的 编程 习惯 也 要 求 你 加 注释 。 特 别 是 ， 多 数 的 汇编 语 
言 标准 通常 要 求 每 行 至 少 有 一 个 注释 。 

本 书 和 jasmin 一 样 ， 对 于 注释 持 有 稍微 不 同 的 观点 。 因 为 jasmin 程 序 中 用 的 很 多 参数 都 
是 长 整数 ， 尤 其 是 字符 串 参 数 以 及 像 系统 输出 这 样 的 标准 对 象 地 址 ， 这 样 ， 在 一 行 中 就 没有 
地 方 再 放 相关 的 注释 了 。 对 于 每 行 一 个 注释 这 个 标准 ， 一 个 更 严重 的 问题 是 可 能 会 鼓励 拙劣 
而 无 有 用 信息 的 注释 。 

作为 一 个 例子 ， 请 见 下 面 这 一 行 语 句 ， 

bipush 5 ， 将 整数 5 装 入 到 堆栈 

这 个 注释 几乎 没有 告诉 程序 员 任 何 东 西 。 毕 竟 语 句 bipush 5 就 是 “将 整数 值 5 装 入 到 堆栈 
上 ”的 意思 。 在 读 到 这 条 语句 时 ， 任 何 程序 员 即 使 独自 在 看 也 知道 这 是 什么 意思 。 为 了 理解 
程序 ， 程 序 员 可 能 还 需要 了 解 更 宽 证 问题 的 答案 。 为 什么 在 这 个 步骤 中 要 将 5 这 个 特定 的 值 压 
人 到 堆栈 中 (而 且 为 什么 要 作为 整数 装 人 ) 呢 ? 通过 强调 语句 在 更 大 范围 的 作用 以 及 成 块 或 
成 组 语句 的 意义 ， 就 能 使 注释 更 加 有 用 和 富 含 信息 。 

bipush 5 ; 装 人 五 边 形 的 边 数 来 度量 
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或 者 ， 甚 至 可 以 写作 ， 
bipush 5  ; 装 和 人 五 边 形 的 边 数 来 计算 周 长 


Pipush 13 ; 依次 装 入 边 1 一 5 的 长 度 

bipush 9 

bipush 7 

bipush 2 

; 现在 将 各 个 边 累 加 在 一 起 

为 此 ， 建 议 不 要 盲目 遵从 “每 行 一 注释 ”这 样 的 人 为 标准 ， 而 是 理性 地 遵从 “注释 应 该 
有 解释 性 ”的 思想 。 而 且 ， 汇 编 语 言 程序 尤其 需要 很 多 解释 。 
3.3.2 汇编 指令 

第 三 类 语句 称 为 汇编 指令 (directive) ， 是 对 汇编 器 本 身 的 指令 ， 告 诉 它 如 何 执行 其 任务 。 
在 jasmin 中 ， 大 多 数 的 汇编 指令 都 用 一 个 旬 点 (.) 开头 ， 如 样 例 程序 中 第 三 行 〈 即 第 一 个 非 
注释 行 ) 所 示 。 例 如 ， 汇 编 指 令 ( .class) 的 功能 就 是 通知 汇编 器 这 个 文件 定义 了 一 个 名 
为 jasminExamp1e 的 类 ， 因 此 ， 要 创建 的 类 文件 名 字 就 是 jasminExample .class。 这 并 不 直接 
影响 将 程序 转换 成 字 节 码 的 过 程 ( 且 不 对 应 于 任何 字 节 码 指令 )， 但 它 直 接 通 知 jasmin 如 何 与 
计算 机 的 其 余部 分 、 磁 盘 以 及 操作 系统 相互 作用 。 

在 这 一 点 上 很 多 汇编 指令 可 能 没有 明确 的 含义 。 这 是 因为 JVM 和 类 文件 本 身 都 直接 捆绑 
到 面向 对 象 结构 和 类 层次 。 例 如 ， 所 有 类 必须 绑 定 到 类 层次 ， 尤 其 必须 是 其 他 类 的 子 类 。( 例 
如 ， 梅 赛 德 斯 Mercedes 是 汽车 car 的 一 个 子 类 ， 而 汽车 是 运输 工具 vehicle 的 一 个 子 类 ， 等 等 。) 
Java 语 言 是 通过 这 样 的 方法 来 实施 这 一 规定 的 ， 对 于 任何 没有 明确 提 及 其 在 层次 中 的 关系 的 
类 ， 默 认 它 是 Object (java/1ang/0bject) 的 子 类 。jasmin 汇 编 器 强制 实施 类 似 的 要 求 ， 就 
是 任何 jasmin 定 义 的 类 必须 包含 一 个 .super 汇 编 指令 ， 以 定义 这 个 新 的 类 是 哪个 超 类 的 子 类 。 
在 各 个 jasmin 程 序 中 ， 程 序 员 通 常 可 简单 地 拷贝 下 面 一 行 而 不 会 有 什么 损害 ， 

.Super java/lang/Object 

其 他 的 汇编 指令 (.method、.end method) 用 于 定义 该 类 与 所 有 其 他 对 象 的 相互 作用 。 
特别 是 ，JVM 所 实施 的 面向 对 象 编程 模型 要 求 ， 从 类 外 部 对 函数 的 调用 要 明确 地 定义 为 
“public 方 法 ”"， 并 且 强 烈 地 鼓励 所 有 函数 都 这 样 定义 。 这 种 定义 的 细节 将 在 第 10 章 做 非常 详 
细 的 讨论 。 


3.3.3 资源 汇编 指令 

从 jasmin 程 序 员 的 角度 看 ， 最 重要 的 汇编 指令 就 是 .1imit。 这 个 汇编 指令 用 来 定义 限制 ， 
或 者 展开 来 说 就 是 在 一 个 方法 中 进行 计算 可 得 到 多 少 资源 。 这 是 JVM (作为 虚拟 机 ) 的 状态 
中 独一无二 而 且 非 常 强大 的 方面 ， 因 为 方法 可 按 其 所 需 使 用 任意 数量 的 资源 。 

特别 是 ， 一 个 典型 的 基于 堆栈 的 微 处 理 器 或 控制 器 (例如 老式 的 英特尔 8087 数 学 协 处 理 
器 芯片 ， 后 来 被 合并 到 80486 及 后 续 机 型 成 为 主 CPU 的 组 成 部 分 ) 就 只 拥有 较 少 的 元 件 (在 这 
种 情况 下 是 8 个 ) 。 一 个 需要 多 于 8 个 元 件 的 计算 就 需要 将 某 些 值 存储 到 CPU 堆栈 以 及 如 主 存储 
器 等 其 他 一 些 地 方 。 程 序 员 必须 确保 数据 按 需 要 移 人 和 移出 存储 器 ， 失 效 的 代价 通常 是 程序 
出 故障 或 整体 功能 不 正常 。 增 加 CPU 内 可 利用 堆栈 空间 的 数量 可 解决 这 个 问题 ， 但 却 会 使 每 
个 CPU 艺 片 更 大 、 更 热 、 更 费 功 耗 而 且 更 昂贵 。 此 外 ， 改 变 不 同型 号 芯片 之 间 的 基本 参数 会 
引入 不 兼容 性 ， 使 得 新 的 程序 不 能 在 老 机 器 上 运行 。 
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在 JVM 上 相应 解决 方法 的 特色 是 于 净利 落 。 可 以 使 用 汇编 指令 ， 

.limit stack 14 

这 条 汇编 指令 作为 一 条 语句 直接 放 在 所 定义 方法 的 内 部 (使 用 .method 汇 编 指 令 ) ， 其 功 
能 是 将 堆栈 的 最 大 尺寸 设置 为 14 个 整数 或 浮 点 大 小 的 元 素 。( 它 也 能 存储 7 个 长 整数 或 双 精 度 
大 小 的 元 素 ， 或 者 5 个 长 整数 / 双 精 度 和 4 个 整数 / 浮 点 元 素 ， 或 者 任何 适当 的 组 合 。) 类 似 地 ， 
在 一 个 方法 中 (int 大 小 的 ) 局 部 变量 的 最 大 数量 可 用 相关 的 汇编 指令 设置 为 12: 

.1imit locals 12 

如 果 这 两 个 汇编 指令 中 的 任何 一 个 被 忽略 ， 则 应 用 一 个 缺 省 的 限制 值 ， 这 个 值 足够 用 于 
单个 整数 或 单个 浮 点 数 ， 却 不 足以 用 于 更 大 的 类 型 。 


3.4 例子 : 随机 数 生 成 


3.4.1 生成 伪 随 机 数 

一 个 常见 但 在 数学 上 很 复杂 的 任务 (而 且 是 计算 机 经 常 要 执行 的 任务 ) 是 生成 狐 似 “ 随 
机 ”的 数 。 例 如 ， 在 计算 机 游戏 中 ， 可 能 有 必要 将 一 副 牌 洗 成 貌似 随机 的 次 序 。 由 于 在 当今 
计算 机 硬件 方面 有 几 个 根本 的 限制 ， 计 算 机 实际 上 没有 能 力 生成 随机 数 (在 统计 学 家 们 所 坚 
持 的 严格 意义 上 )。 作 为 替代 ， 计 算 机 生成 的 是 确定 性 的 伪 随 机 数据 ， 这 些 数据 虽然 在 技术 上 
来 看 可 预测 ， 但 看 起 来 似乎 是 不 可 预测 的 。 

我 们 在 这 里 关注 的 是 生成 均匀 分 布 在 0~n 这 一 范围 内 的 随机 整数 。 如 果 由 于 某 种 原因 用 户 
希望 生成 随机 的 浮 点 数 ， 可 以 通过 简单 地 将 随机 整数 除 以 x+1 得 到 。 如 果 z* 足 够 大 ， 这 种 方法 
就 对 实数 在 区 间 [0,1) 上 的 均匀 分 布 给 出 了 一 个 很 好 的 近似 。( 例 如 ， 如 果 n 是 999， 浮 点 数 就 是 
集合 {0.000,0.001,0.002,.…,0.999} 中 的 一 个 。 如 果 n 是 10 亿 ， 最 终 的 数 看 起 来 就 非常 随机 。) 

从 数学 上 看 ， 计 算 机 接收 一 个 给 定 的 数 ( 即 种 子 ) 并 返回 一 个 相关 但 貌似 不 可 预测 的 数 。 
通常 的 做 法 就 是 采用 所 谓 的 线性 同 余数 生成 器 (linear congruential generator) 。 采 用 这 种 方法 ， 
对 于 特定 的 4、c 及 m 值 返回 的 数 由 下 面 形 式 的 公式 生成 ，: 


newvalue = (a : oldvalue+c) mod m 


例如 ， 因 为 计算 mod m 给 出 的 最 大 结果 是 m 一 1， 所 以 参数 m 决 定 了 返回 的 随机 数 的 最 大 值 ， 
由 此 n=m 一 1。 在 选择 最 佳 4q 和 c 的 取 值 方面 有 很 多 理论 研究 ， 所 以 过 多 在 这 方面 探究 就 离 题 太 
远 了 。oldvalue 的 值 必须 在 每 次 运行 生成 器 时 重新 选择 ， 因 为 rxewvalue 的 值 严 格 依赖 于 它 。 这 
个 生成 器 可 重复 使 用 来 生成 一 序列 的 〈 伪 ) 随机 数 ， 所 以 对 每 个 程序 只 需要 确定 一 次 种 子 。 
初始 种 子 的 典型 来 源 包括 (对 程序 来 说 ) 真正 的 随机 值 ， 如 一 天 的 当前 时 间 、 进 程 的 ID 号 、 
鼠标 的 最 近 运动 等 等 。 
3.4.2 在 JVM 上 实现 

为 了 在 JVM 上 实现 这 个 算法 ， 就 要 做 出 一 些 设计 决策 。 基 于 实际 的 原因 ，oldvalue 的 值 可 
能 要 存储 在 局 部 变量 中 ， 因 为 其 值 在 每 次 调用 时 会 发 生变 化 ， 但 是 a、c 及 m 的 值 可 以 作为 常数 
存储 和 操作 。 为 了 简便 起 见 ，oldvalue 和 newvalue 的 值 都 被 存储 成 整数 作为 一 个 堆栈 元 素 ， 但 
那些 中 间 值 ， 尤 其 是 a 和 c 是 大 数 时 ， 就 可 能 使 单个 堆栈 元 素 溢出 ， 因 此 必须 将 它们 存 成 长 整 
数 类 型 。 无 需 多 做 解释 ， 我 们 采用 可 存储 成 (有 符号 ) 整数 的 最 大 质数 (2 147 483 647) 作 
为 m 的 值 ， 并 选择 质数 2 +1 (=65537) 作为 a 的 值 ，5 作 为 c 的 值 。 
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计算 本 身 简单 明了 。 上 面 的 表达 式 

(a : oldvaluetc) mod m 
可 用 JVM ( 逆 波 兰 法 ) 表示 成 ; 

a oldvalue -c+ m mod 


因此 ， 适 合 的 JVM 指 令 如 下 : 


; 计算 a*oldvalue 


1dc2_w 65537 ; a 为 2*16 二 1， 存储 成 长 整数 
i1oad_1 ; 0ldvalue (假设 ) 被 存储 成 局 部 变量 #1 
i21 4 将 0o1dvalue 转 换 成 长 整数 
1mul ; 做 乘法 
+ 加 c . 
1dc2_w 5 ; Cc 是 5， 存 储 成 长 整数 
ladd ; 加 入 到 a*oldvalue 
; 得 到 mod m 的 余数 
1dc2_w 2147483647 ”， 装 入 m 的 值 
1rem ; 取 模 ( 求 余 数 ) 
12i ; 转换 回 整 数 


; newvalue 现 在 就 留 在 堆栈 顶部 


补充 资料 

参数 传递 、 局 部 变量 以 及 堆栈 

大 多 数 程序 要 求 输入 是 有 用 的 。 事 实 上 ， 大 多 数 函 数 和 方法 都 要 求 输 入 是 有 用 的 。 让 方法 
获得 信息 的 标准 方式 是 通过 参数 传递 。 例 如 , 定义 正弦 通常 要 有 一 个 形式 参数 (formal parameter)。 
当 使 用 正 防 函数 时 ， 相 应 的 实际 参数 (actual parameter) 就 被 传递 到 函数 并 用 于 计算 。 

JVM 用 一 种 相当 奇特 的 方式 来 处 理 这 个 过 程 。 在 传统 基于 芯片 的 体系 结构 中 ， 计 算 机 在 
内 存 中 采用 一 个 共享 的 “堆栈 ”来 分 隔 不 同 程序 或 函数 所 使 用 的 存储 区 域 。 与 之 相反 ，JVM 
对 每 个 方法 提供 了 唯一 的 私 用 堆栈 。 这 就 避免 了 一 个 方法 闻 入 并 毁坏 程序 的 其 他 部 分 所 独 有 
的 数据 ， 从 而 极 大 地 增强 了 安全 性 ， 却 使 一 个 函数 向 另 一 个 函数 传递 数据 变 得 困难 。 作 为 蔡 
代 的 方法 是 ， 当 一 个 函数 /方法 被 调用 时 ， 参 数 被 (JVM) 置 于 方法 所 能 得 到 的 局 部 变量 中 。 
一 般 来 说 ， 第 一 个 参数 被 置 于 局 部 变量 #， 第 二 个 参数 被 置 于 局 部 变量 所 ， 依 此 类 推 。 

对 这 个 一 般 规 则 有 3 个 例外 。 首 先 ， 如 果 参 数 太 大 ， 不 能 装 入 到 单个 堆栈 元 素 (长 整 
数 或 双 精 度数 ) 中 ， 就 要 置 于 两 个 连续 的 元 素 中 (所 有 后 来 的 元 素 就 要 多 下 移 一 个 元 素 位 
置 ) 。 其 次 ， 这 个 规则 没有 考虑 局 部 变量 #40。 通 常 对 于 实例 方法 (instance method)， 对 当 
前 对 象 的 引用 将 用 #0 传 递 。 定 义 为 静态 (static) 的 变量 没有 当前 对 象 ， 因 此 ， 将 第 一 个 
参数 传递 到 局 部 变量 #1、#40， 依 此 类 推 。 

最 后 ，Java 1.5 定 义 了 一 个 新 的 参数 传递 方法 ， 在 参数 数量 变化 的 时 候 可 以 采用 。 在 
这 种 情况 下 ， 数 量变 化 的 参数 将 被 转换 成 数组 并 作为 单个 数组 参数 传递 (可 能 在 #1 中 )。 
被 调用 的 方法 负责 确定 实际 上 要 传递 多 少 参数 ， 并 正确 地 对 其 进行 操作 。 

在 不 是 JVM 的 机 器 上 使 用 堆栈 进行 参数 传递 的 方法 将 在 后 续 章 节 讨 论 特 定 机 器 时 详细 
描述 。 
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通过 观察 ， 在 这 些 计算 中 所 需 的 最 大 堆栈 深度 是 两 个 长 尺寸 ( 双 精 度数 ) 堆栈 元 素 ， 所 
以 这 可 在 堆栈 限制 为 4 或 更 多 时 用 任何 方法 执行 。 类 似 地 ， 给 出 的 代码 假设 o1dvalue 存 储 在 局 
部 变量 #1 中 。 因 为 变量 从 0 开始 编号 ， 这 就 意味 着 程序 需要 两 个 局 部 变量 。(oldvalue 要 存储 在 
变量 和 中 的 原因 是 :在 某 些 情况 下 ， 局 部 变量 和 加 由 Java 类 环境 所 保留 。) 

为 了 使 这 个 程序 正确 运行 ， 包 含 这 个 代码 的 方法 需要 两 个 汇编 指令 ; 


.1imit stack 4 
.1imit locals 2 


这 个 代码 有 几 个 变型 ， 它 们 也 能 工作 。 像 大 多 数 的 编程 问题 一 样 ， 存 在 若干 个 正确 的 解 
决 方 案 。 最 明显 的 是 ， 两 条 汇编 指令 可 颠倒 次 序 ， 先 定义 局 部 变量 再 定义 堆栈 大 小 。 更 复杂 
的 变化 是 采用 不 同 的 操作 次 序 来 进行 计算 ， 也许 是 ， 先 压 人 ec， 做 乘法 ， 然 后 做 加 法 。 从 技术 
上 说 ， 这 就 是 实现 等 价 但 不 同 的 逆 波 兰 表 达 式 : 

caoldvalue : +m mod 

如 果 选 择 了 这 种 实现 ， 则 堆栈 的 最 大 深度 就 是 3 个 长 元 素 ， 需 要 一 个 .1imit stack 6 汇编 
指令 。 
类 似 地 ， 执 行 很 多 小 的 步骤 也 有 一 些 等 价 的 方式 。 如 果 不 是 (用 1dc2_w 5) 将 值 5 作 为 长 
整数 直接 压 人 ， 程 序 员 也 可 以 〈 用 iconst_5) 将 值 5 作 为 整数 压 人 ， 然 后 再 (用 i21) 将 其 转 
换 成 长 整数 。 这 会 将 一 条 指令 换 成 两 条 ， 但 这 两 条 替换 成 的 指令 可 能 更 短 且 执行 更 快 。 然 而 ， 
像 这 样 的 微小 改变 很 少 能 对 程序 的 大 小 和 速度 有 重大 的 影响 。 更 常见 的 情况 是 ， 这 些 只 是 执 
行 相同 任务 的 不 同方 式 ， 并 有 可 能 使 新 手 程序 员 不 知 所 措 ， 因 为 他 往往 期 望 对 一 个 给 定 问题 
只 有 一 个 解 。 


3.4.3 另 一 种 实现 

不 但 上 面 提 到 的 随机 数 生 成 问题 有 多 种 解决 方案 ， 而 且 有 很 多 不 同 的 算法 和 参数 能 解决 
这 个 问题 。 仔 细 地 考察 JVM 的 表示 方案 ， 就 可 以 得 出 优化 的 而 且 更 复杂 的 随机 数 生成 器 。 特 
别 是 ， 由 于 涉及 整数 的 数学 运算 总 是 采用 32 位 的 量 来 执行 ， 将 数 对 2?? 取 模 就 是 自动 进行 的 。 
通过 将 m( 隐 含 地 ) 置 为 22， 程 序 员 就 能 避免 涉及 取 模 这 部 分 计算 。 而 且 ， 如 果 所 有 的 计算 
都 隐 含 地 以 这 种 模 的 形式 来 完成 ， 就 不 需要 使 用 长 尺寸 的 存储 器 或 堆栈 元 素 。 

采用 这 种 模 能 产生 好 的 随机 数 生 成 器 的 一 组 数 是 ， 置 a 为 69069， 置 c 为 0。( 这 些 数 实际 上 
是 由 研究 者 George Marsaglia 所 提出 的 “ 极 高 超 ”(Super-Duper) 生成 器 的 一 部 分 。) 特别 是 将 
c 置 为 0 还 会 简化 代码 ， 因 为 无 需 做 加 法 。 所 得 到 的 代码 将 短小 、 简 单 而 且 优 雅 。 


; 计算 a * oldvalue 

1dc2_w 69869 ; 为 Super-Duper 提 出 的 ， 作 为 8 的 值 
iload_1 ;假设 o1dvalue 存 储 为 局 部 变量 1 
imul ， 做 乘法 〈 隐 含 地 取 2^32 模 ) 


; newvalue 现 在 就 在 堆栈 顶部 

那么 ， 哪 个 随机 数 生 成 器 更 好 呢 ? 比较 生成 器 的 优 劣 可 能 是 非常 困难 ， 并 可 能 涉及 相当 
高 强度 的 统计 计算 。 此 外 ， 根 据 你 的 应 用 不 同 ， 线 性 同 余 法 一 般 会 有 一 些 不 好 的 性 质 。 而 且 ， 
根据 使 用 生成 器 的 方式 不 同 ， 结 果 的 某 些 位 可 能 会 比 其 他 位 更 随机 。 例 如 ， 如 果 oldvalue 是 奇 
数 ， 第 二 个 生成 器 就 会 总 是 生成 奇数 ， 否 则 就 会 总 是 生成 偶数 。 只 使 用 高 序 字 比 只 使 用 低 序 
字 会 给 出 好 得 多 的 结果 。 对 这 些 生成 器 所 产生 数 的 质量 比较 时 ， 最 容易 的 方式 是 将 它们 都 在 
计算 机 上 实现 ， 且 都 运行 儿 千 、 几 百 万 或 者 几 士 亿 次 ， 并 根据 所 期 望 的 用 途 接 受 统计 检验 。 

从 速度 的 角度 看 (而 且 更 重要 地 ， 从 计算 机 组 成 和 汇编 语言 课程 的 角度 看 )， 显 然 第 二 种 
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随机 数 生成 器 会 运行 得 更 快 。 不 仅 是 因为 它 涉及 了 更 少 的 操作 ， 而 且 因为 这 些 操作 本 身 会 按 
整数 运算 来 运行 ， 因 此 比 第 一 个 生成 器 的 长 操作 速度 快 。 


3.4.4 与 Java 类 交互 

(这 一 节 可 跳 过 而 不 影响 连续 性 ， 假 设 你 具备 一 些 Java 编 程 知识 。) 

既然 这 样 ， 为 什么 要 假设 种 子 (oldvalue) 存储 在 局 部 变量 #1 中 呢 ? 这 直接 关系 到 方法 如 
何 用 Java 实 现 以 及 JVM 如 何 处 理 类 之 间 的 对 象 和 方法 的 相互 作用 。 特 别 是 ， 一 且 一 个 对 象 的 
方法 被 调用 ，JVM 就 以 局 部 变量 #0 传递 对 象 本 身 (作为 引用 类 型 变量 来 传递 ， 因 而 在 操作 助 
记 符 中 就 以 a 打头 )， 而 各 种 方法 参数 则 以 局 部 变量 #1、#2、#3 等 等 依次 传递 (根据 需要 可 以 
有 任意 数量 的 变量 /参数 ) 。 

为 了 正确 地 运行 ， 上 面 描述 的 第 二 个 生成 器 就 要 置 于 一 个 至 少 有 两 个 堆栈 元 素 和 至 少 两 
个 局 部 变量 (一 个 用 于 对 象 ， 一 个 用 于 种 子 值 ) 的 方法 中 。 一 个 完整 的 jasmin 样 例 程 序 见 图 
3-4, 该 程序 定义 了 一 个 特殊 的 类 (jrandGenerator.class) 和 两 个 方法 , 一 个 用 于 对 象 创建 ， 
另 一 个 用 于 通过 上 述 的 第 二 种 方法 生成 随机 数 。 


; 定义 jrandGenerator 作 为 0bject 的 一 个 子 类 

; 定义 与 此 相关 的 类 文件 为 jrandGenerator.class 
,Class public jrandGenerator 

.Super java/lang/O0bject 


标准 步骤 ， 与 前 面 一 样 
.method public <init>()V 
aload_0 


invokespecial java/lang/D0bject/<init>OV 
return 
.end method 


; 定义 一 个 Generate( ) 方 法 ,接受 整数 并 返回 整数 
.method public Generate(I)I 

; 为 计算 ， 我 们 需要 两 个 堆栈 元 素 

.limit stack 2 


;我 们 还 需要 两 个 局 部 变量 ， 其 中 所 保存 参数 
; 由 于 这 是 一 个 标准 的 方法 ， #0 会 由 Java 本 身 设置 


.limit locals 2 


; 计算 a*o1d_value (并 存储 在 堆栈 顶部 ) 

ldc 69069 ; 作为 a 的 值 

iload_1 ; 01d_value 假 设 存储 为 局 部 变量 1 

; 做 乘法 ( 隐 含 地 完成 mod 2^32 运 算 ) 


imul 


; new_value 被 存储 在 堆栈 顶部 ， 作 为 整数 返回 


ireturn 


.end method 





图 3-4 jasmin 中 完整 的 随机 数 生 成 过 程 


该 程序 的 结构 与 先前 打印 一 个 字符 串 的 程序 有 紧密 的 对 应 关系 。 然 而 ， 与 先前 程序 不 同 
的 是 ， 没 有 定义 main(0) 方 法 (不 要 求 jrandGenerator 类 是 一 个 独立 的 程序 )。 它 要 求 的 是 多 个 
局 部 变量 (定义 在 .1imit 汇 编 指令 中 )， 另外 Generate 方 法 的 参数 和 返回 类 型 已 经 改变 ， 以 反 
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映 其 作为 随机 数 生 成 器 的 用 途 。 

当 用 jasmin 程 序 进行 汇编 时 ， 结 果 将 是 一 个 名 为 jrandGenerator .class 的 Java 类 文件 。 
在 Java 编 程 环境 中 ， 这 个 类 的 对 象 与 其 他 任何 对 象 一 样 创建 和 使 用 ， 如 图 3-5 所 示 。 这 个 简单 
的 程序 只 是 创建 了 一 个 jrand6Generator 的 实例 ， 并 在 其 上 连续 快速 地 调用 10 次 Generate 方 法 ， 
因而 生成 了 10 个 随机 数 。 


public class jrandExample { 
public static void main(String args[]) { 
int i; 
int old_value = 1; 
jrandGenerator g = new jrandGenerator(); 


for (i=0;i<10;i++) 荆 

old_value = g.Generate(old_value) ; 

System.out .Println("Generated: " + old_value) ; 
} 


return; 





图 3-5 调用 jrandGenerator 的 Java 程 序 


类 似 地 可 写 一 个 程序 生成 1 千 万 个 随机 数 ， 或 者 调用 一 个 不 同 的 生成 器 (实现 前 述 的 第 一 
个 随机 数 生成 方法 )。 


3.5 本 章 回 顾 


*JVM 与 高 级 编程 语言 Java 一 起 设计 ， 因 此 支持 一 种 类 似 的 面向 对 象 的 程序 设计 (OOP) 
风格 。 虽然 并 非 必 须 在 jasmin 编 程 中 使 用 OOP， 但 这 通常 是 一 种 好 的 想法 。 

。Java 程 序 和 jasmin 程 序 必须 都 转换 成 .class 文 件 后 才能 由 JVM 执 行 。 

。 将 jasmin 程 序 转 换 成 (本 书 中 用 到 的 ) 类 文件 的 命令 通常 命名 为 jasmin。 在 写 这 本 书 
的 时 候 ， 可 以 在 Jon Meyer 的 Web 站 点 或 相关 的 Web 站 点 http://prenhalil. com juola 
上 免费 得 到 。 

。 由 于 有 大 量 不 同 的 设备 ， 所 以 输入 和 输出 是 典型 的 困难 问题 。Java 和 JVM 通 过 使 用 类 系 
统 来 简化 这 个 问题 。 通 过 熟 记 三 条 正确 的 jasmin 语 句 ， 程 序 员 就 能 在 任何 时 间 将 (任何 
类 型 ) 数据 发 送 到 标准 输出 。 

“汇编 语言 语句 可 分 成 3 种 主要 的 类 型 : 指令 〈 要 被 转换 成 字 节 码 机 器 指令 )、 注 释 (被 计 
算 机 忽略 ) 以 及 汇编 指令 (要 影响 转换 /汇编 过 程 本 身 )。 

。 汇 编 指 令 用 于 定义 类 文件 如 何 租 入 到 标准 Java 类 层次 中 。 

。 汇 编 指令 ， 尤 其 是 .1imit 汇 编 指令 ， 也 用 于 控制 方法 和 函数 所 能 得 到 的 资源 数量 。 特 别 
是 .1imit stack Xx 要 设置 最 大 堆栈 尺寸 , 而 .1imit 1ocals Y 要 设置 局 部 变量 的 最 大 
数量 。 


3.6 习题 


1. 编译 器 和 汇编 器 的 区 别 是 什么 ? 
2. 列 出 至 少 5 条 只 需 一 个 参数 的 指令 ( 助 记 符 )。 


全 ww 


CD 


一 


iD 


全 


LA 


CN 


vv 
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. 计算 机 如 何 辨 识 出 一 个 给 定 的 行 包含 的 是 一 个 汇编 命令 、 一 个 注释 还 是 一 条 指令 ? 
:如果 你 忘记 了 .1imit 汇 编 命令 ， 你 的 jasmin 程 序 还 能 工作 吗 ? 


.7 编程 习题 
. 写 一 个 jasmin 程 序 ， 将 下 面 的 诗 显 示 在 一 个 Web 页 面 上 。 


There once wad a lady named Nan 

Whose limericks never would scan 

When she was asked why 

She replied with a sigh. 

“It’s because I always try to put as many syllables into the last line as I possibly can” 


. 写 一 个 jasmin 程 序 ， 显示 如 下 所 示 的 由 大 写 O 组 成 的 三 角 图 案 。 


. 写 一 个 jasmin 程 序 ， 用 以 下 格式 显示 今天 的 日 期 ，Today is Monday, 9/19/2008 。 
. 写 一 个 jasmin 程 序 ， 计 算 并 显示 在 下 面 情形 下 我 应 得 的 报酬 ， 这 个 月 ， 对 于 每 小 时 薪金 


25.00 美 元 的 工作 我 的 工作 时 间 是 80 个 小 时 ， 对 于 每 小 时 薪金 15.50 美 元 的 工作 我 的 工作 时 间 
是 40 个 小 时 ， 对 于 每 小 时 薪金 35.00 美 元 的 工作 我 的 工作 时 间 是 45 个 小 时 。 


.波音 777-300 飞 机 的 最 大 载 客 量 为 386。 写 一 个 程序 ， 确 定 为 了 承载 W 个 人 做 环球 旅行 ， 你 需 


要 包租 多 少 架 飞机 。 你 可 以 在 程序 中 用 一 个 特定 的 N 值 。( 注 意 ， 飞 机 按 架 包租 ， 不 允许 包 
租 一 架 飞 机 的 五 分 之 三 。) 


.2 月 29 日 这 一 日 期 每 4 年 只 出 现 一 次 。 例 如 ， 在 2000 年 、2004 年 及 2008 年 出 现 。 如 果 我 的 一 


个 朋友 出 生 于 1980 年 2 月 29 日 ， 而 当前 的 年 份 是 Yi， 写 一 个 程序 ， 告 诉 我 他 实际 上 已 经 有 多 
少年 能 庆祝 生日 。( 你 可 以 假设 他 今年 没 能 庆祝 生日 。) 


. 与 圣诞 节 不 同 〈 总 是 在 12 月 25 日 )， 复 活 节 每 年 的 日 期 都 不 一 样 。 《自然 》 杂志 的 一 位 匿 


名 记者 发 表 了 确定 复活 节日 期 的 算法 。( 这 个 算法 后 来 被 米 斯 郡 主教 Samuel Butcher 证 明 是 
正确 的 ， 因 此 被 称 为 Butcher 算 法 ) 。 所 有 值 都 是 整数 ， 所 有 除法 都 是 整数 除 ， 且 mod 的 意思 
是 整数 取 模 (除法 后 的 余数 ): 

， 设 y 为 相关 年 

。 设 C 为 ?mod 19 

。 设 8 为 XM100 

。 设 c 为 y mod 100 

。 设 d 为 b/4 

。 设 e 为 5 mod 4 

。 设 /为 (5+8)/25 

“ 设 8 为 (一 片 1)/3 


昌 《自然 》. April 20, 1876, vol, 13,p.487. 
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。 设 有 为 (19 : a+pb 一 d 一 gs+15) mod 30 

。 设 ;为 c/4 

。 设 k 为 ce mod 4 

。 设 /为 (32+2 . e+2 :ih 一 k) mod 7 

。 设 m 为 (a+11 : h+22 . 1)/451 

。 设 p 为 (h+l 一 7 . m+114) mod 31 

。 复 活 节 月 是 (p+I-7 . m+114)/31.(3=3 月 , 4=4 月 ). 
。 复 活 节 日 是 p+1 

实现 这 个 算法 ， 确 定 下 10 个 复活 节 的 日 期 。 


第 4 章 控制 结构 


4.1 他 们 教 给 你 的 都 是 错误 的 


4.1.1 再 谈 取 指 一 执行 

在 第 2 章 和 第 3 章 中 ， 我 们 探 计 了 如 何 用 JVM 的 基于 堆栈 的 计算 写 出 复杂 的 数学 表达 式 并 
对 其 进行 求 值 。 通 过 将 参数 压 人 计算 堆栈 并 执行 适当 的 基本 操作 序列 ， 就 能 使 计算 机 或 多 或 
少 地 按 人 的 吟 只 进 行 工 作 。 从 实用 化 的 观点 看 ， 计 算 机 的 真正 优势 是 其 拥有 这 样 的 能 力 ， 即 
它 能 不 厌 其 烦 或 正确 无 误 地 反复 执行 任务 。 

回顾 JVM 的 表示 结构 ， 不 难看 出 如 何 使 计算 机 反复 执行 相同 的 代码 模块 。 记 住 ， 程 序 代 
码 是 由 连续 的 机 器 指令 组 成 的 ， 在 计算 机 的 存储 器 中 存储 为 连续 的 元 素 。 为 了 执行 一 个 特定 
的 语句 ， 计 算 机 首先 从 存储 器 中 取出 当前 指令 ， 解 释 并 执行 该 指令 ， 然 后 更 新 “当前 指令 ” 
的 标志 。 正 式 地 说 ， 当 前 指令 就 是 一 个 存储 在 程序 计数 器 (PC) 中 的 数 ， 指 向 当前 方法 字 节 
代码 的 位 置 。 每 次 取 指 一 执行 周期 发 生 ， 存 储 在 PC 中 的 值 就 增加 1 个 或 更 多 字 节 ， 使 得 它 指向 
要 执行 的 下 一 条 指令 。 

为 什么 是 1 个 “或 更 多 ” 字 节 呢 ? 难道 PC 不 应 该 每 次 增加 1 吗 ? 事实 上 不 是 这 样 ， 因 为 一 
些 操作 需要 多 个 字 节 来 定义 。 例 如 , 像 irem 这 样 的 基本 算术 操作 只 需要 1 个 字 节 来 定义 。 然 而 ， 
像 bipush 这 样 的 操作 用 1 个 字 节 就 不 够 了 。bipush 规 定 要 将 1 个 字 节 压 人 到 堆栈 〈 并 被 提升 成 
为 32 位 整数 ) ， 但 它 本 身 并 不 规定 要 压 人 哪个 字 节 。 一 且 使 用 了 这 条 指令 ，bipush 的 操作 代码 
(0x10) 后 面 就 要 跟 一 个 要 压 入 的 字 节 。 正 如 所 料 ，sipush 指 令 (0x11) 后 面 跟 的 就 不 是 1 个 
而 是 2 个 要 压 入 的 字 节 (是 一 个 短 整 数 ) 。 类 似 地 ，i1oad 指 令 后 跟 1 个 或 2 个 字 节 ， 描 述 了 要 装 
入 的 局 部 变量 。 相 比 之 下 ，i10ad_1 快 捷 操作 (0x1B) 自动 地 装 入 局 部 变量 #1， 这 样 就 能 用 1 
个 字 节 来 表示 。 

由 于 操作 大 小 是 变化 的 ， 为 了 取出 全 部 的 指令 及 其 所 有 参数 ， 取 指 一 执行 周期 就 需要 足 
够 聪明 ， 能 一 次 或 依次 取出 可 能 的 若干 个 字 节 。PC 的 更 新 必须 反映 取出 指令 的 大 小 。 一 旦 这 
些 困 难得 到 处 理 ， 将 PC 设置 为 适当 位 置 就 能 使 得 JVM 自 动 地 执行 指令 序列 。 因 此 ， 如 果 有 强 
制 PC 包 含 某 个 特定 值 的 方法 ， 就 能 使 计算 机 反复 执行 那个 代码 块 。 通 过 控制 PC， 就 能 直接 控 
制 计算 机 做 什么 以 及 做 多 少 次 。 

在 后 面 的 几 个 小 节 中 ， 这 种 直接 控制 就 等 价 于 常 遭 茂 视 的 goto 语 句 。 常 常 告知 并 一 直 灌 
输 学 生 们 的 是 避免 使 用 这 种 指令 ， 因 为 与 控制 方便 的 程序 块 的 相 比 它们 会 引入 更 多 的 错误 。 
在 高 级 语言 中 ， 学 生 们 在 学 习 编程 方法 时 被 告知 要 避免 使 用 goto 语 句 。 在 汇编 语言 一 级 ， 就 
赤 手 空 源 了 ， 我 们 能 做 的 最 好 事情 就 是 理解 它们 。 


4.1.2 转移 指令 和 标号 

任何 可 能 导致 PC 改变 其 值 的 语句 通常 称 为 “转移 ”指令 。 与 正常 的 取 指 -执行 周期 不 同 ， 
一 条 转移 指令 可 能 转 到 任何 地 方 。 为 了 定义 目标 位 置 ，jasmin 像 大 多 数 其 他 的 汇编 语言 一 样 ， 
允许 单个 指令 接受 标号 (label) ， 使 其 能 作为 个 体 被 引用 。 不 是 所 有 的 指令 都 会 得 到 这 样 的 标 - 
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号 ,但 任何 语句 都 能 得 到 。 要 调整 PC， 可 以 使 用 适当 的 语句 ， 然 后 给 出 目标 指令 的 标号 。 
那么 ， 一 个 转移 语句 是 如 何 生成 和 存储 的 呢 ? 更 详细 地 说 ， 就 是 什么 是 “标号 ”? 标号 
如 何 被 存储 成 位 的 序列 ， 像 一 个 数 或 机 器 指令 那样 吗 ? 从 程序 员 的 角度 看 ， 标 号 就 是 一 个 独 
立 的 一 行 ， 可 以 保存 或 不 保存 任何 指令 ， 标 号 本 身 是 一 个 标记 了 指令 的 字 (由 字母 和 数字 组 
成 ， 以 字母 开头 ， 按 惯例 是 大 写字 母 ， 后 跟 一 个 冒号 [:]) 。 要 将 控制 传递 到 一 个 给 定 的 位 置 ， 
就 要 在 一 个 适当 的 转移 语句 中 使 用 标号 (不 加 冒号 ) 作为 参数 。 例 如 : 
goto Somewhere ; 将 PC 的 值 设置 为 Somewhere 的 位 置 


4.1.3 结构 化 编程 ， 转 移 一 下 注意 力 

从 机 器 设计 的 观点 看 ， 控 制 PC 的 最 简单 的 方式 就 是 将 其 作为 一 个 寄存 器 或 局 部 变量 来 看 
待 ， 并 为 之 指定 适当 的 值 ( 见 图 4-1)。 当 一 个 特定 的 值 被 放 入 到 PC 时 ， 机 器 将 转移 到 那个 位 
置 并 开始 执行 代码 。 . 

这 当然 就 是 无 限度 地 滥用 goto 语 句 。 

， 做 一 些 计算 

; 再 做 一 些 计 算 

goto ALabe1， 现在 将 控制 直接 传递 到 ALabel 

; 这 条 语句 被 跳 过 

; 这 条 语句 也 被 跳 过 

ALabel: 

; 但 我 们 从 这 里 的 语句 开始 

; 并 以 正常 的 方式 继续 运行 


nm [二 一 
rc [Bm 


rc [voor 


一 A goto Ox3003 
中 [一条 指 人 


PC [sa | 





图 4-1 执行 了 一 条 goto 语 句 的 取 指 -执行 周期 


根据 现代 程序 设计 的 实践 (大 约 1970 年 以 来 以 及 Dijkstra 的 非常 有 影响 的 工作 )， 使 用 goto 
语句 的 编程 遭 到 严厉 的 责难 。 一 个 原因 就 是 无 保护 的 goto 可 能 是 危险 的 。 将 一 个 随机 的 位 置 放 
入 到 PC 将 会 导致 计算 机 执行 存储 在 那个 位 置 的 任何 指令 。 如 果 那 个 位 置 是 计算 机 代码 ， 还 算 可 
以 。 如 果 那 个 位 置 恰好 (比如) 处 于 存放 串 变 量 的 存储 位 置 中 间 ， 计 算 机 就 会 将 串 的 各 个 字 节 
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看 成 是 程序 代码 并 开始 执行 。( 例 如 ， 在 JVM 中 ，ASCII 字 符 65 (A) 对 应 于 1store_2， 就 会 导 
致 计算 机 试图 从 堆栈 弹出 一 个 长 整数 。 如 果 堆 栈 顶部 没有 这 样 的 长 整数 ， 就 会 引发 程序 崩溃 ) 。 
一 个 潜在 的 更 严重 的 问题 是 带 有 goto 语 句 的 程序 会 引起 混乱 并 因而 易于 出 错 。 从 作为 goto 
目标 的 语句 的 角度 看 ， 在 程序 的 形象 结构 、 字 节 码 级 的 程序 语句 顺序 以 及 程序 语句 的 执行 顺 
序 之 间 没 有 明显 的 关系 。 请 看 下 面 的 简单 语句 序列 : 
iload.1 
iload_2 
Branch: 
iload_3 
iadd 
imul ， 

该 序列 可 能 并 不 像 不 经 心 的 读者 所 想 的 那样 ， 因 为 代码 可 能 通过 一 个 goto 语 句 转 到 第 3 个 
iload_N 语 名 来 执行 。 这 样 ， 存 储 在 局 部 变量 #3 中 的 值 被 加 入 到 (并 被 乘 以 ) 某 个 并 不 明确 的 
值 。 在 特别 糟糕 的 情况 下 ， 控 制 结构 可 能 是 完全 混乱 的 (通常 被 比喻 成 意大利 式 细 面条 ) ， 存 
在 导致 程序 员 混 乱 的 所 有 常见 问题 。 

由 于 这 个 原因 ， 现 代 “ 结 构 化 编程 ”推荐 使 用 高 阶 控制 结构 ， 如 块 结构 的 循环 和 判定 语 
名 。 然 而 ， 在 机 器 代码 级 别 ， 任 何 反映 不 同 计算 的 变化 必须 通过 对 PC 的 变化 表达 出 来 ， 这 样 
就 要 求 有 一 个 隐 含 的 goto。 

那么 ， 为 什么 希望 程序 员 不 用 goto 语 句 来 编程 呢 ? 结构 化 编程 的 思想 不 是 完全 避免 使 用 
goto， 而 是 限制 其 在 不 会 引起 混乱 的 场合 使 用 。 特 别 是 ， 程 序 应 尽 可 能 模块 化 (由 逻辑 上 分 
开 的 代码 片断 组 合 而 成 ， 这 些 代码 片断 在 概念 上 可 作为 单个 操作 看 待 ) 。 这 些 模块 应 尽 可 能 有 
单一 的 起 始点 和 单一 的 退出 点 ， 理 想 情况 是 起 始点 和 退出 点 分 别 在 实际 代码 的 顶端 和 底 端 。 
(这 常常 被 规范 化 为 “ 单 和 人 口 / 单 出 口 ” 原 则 ， 作 为 结构 化 编程 定义 的 组 成 部 分 ) 。 高 级 语言 
常 通过 其 设计 防止 违反 单 人 口 / 单 出 口 规则 。 大 体 上 ， 同 样 的 原则 能 够 也 应 该 应 用 到 汇编 语言 
编程 中 。 虽 然 语言 本 身 会 给 你 灵活 性 以 至 于 做 出 非常 思春 和 混乱 的 事情 ， 但 训练 有 素 的 程序 
员 会 抵制 这 种 诱惑 。 熟 悉 高 级 控制 结构 (如 if 语 句 和 循环 ) 的 程序 员 会 努力 使 用 类 似 的 易于 理 
解 的 结构 ， 甚 至 是 在 jasmin 中 ， 使 得 他 们 及 其 合作 者 能 够 准确 地 领会 程序 的 意图 。 


4.1.4 高 级 控制 结构 及 其 等 效 结构 

一 个 简单 的 例子 有 助 于 阐明 这 一 点 。 图 4-2 和 图 4-3 分 别 用 Java/C++ (还 有 很 多 其 他 语言 ) 
和 Pascal 给 出 类 似 的 循环 例子 。 两 个 例子 实现 的 都 是 从 100 计 数 直到 0， 在 每 次 循环 都 会 做 一 些 
聪明 的 事情 。 做 聪明 事情 的 模块 是 用 最 高 效 的 方式 写成 的 连续 一 组 机 器 指令 。 当 装 和 人 了 这 组 
指令 的 首 条 指令 的 地 址 时 ， 整 个 模块 就 将 被 执行 。 





for (i=100; i > 0; 1--) { for i := 100 downto 1 begin 
// 做 100 次 聪明 的 事情 d { 做 100 次 聪明 的 事情 } } 
en 
图 4-2 用 Java 或 C++ 写 的 循环 示例 图 4-3 用 Pascal 写 的 等 价 示例 


为 了 执行 这 个 模块 若干 次 ， 计 算 机 需要 在 每 次 模块 的 起 始点 决定 该 模块 是 否 还 需要 再 
(至 少 ) 执行 一 次 。 对 于 图 中 循环 的 情况 ， 决 策 很 容易 做 出 : 如 果 计数 器 大 于 0， 则 模块 应 再 
次 执行 。 在 这 种 情况 下 ， 就 转 到 模块 的 开始 处 〈 并 递减 计数 器 ) ， 否 则 ， 如 果 计 数 器 小 于 或 
等 于 0， 就 不 再 执行 循环 并 转移 到 程序 的 其 余部 分 。 

非 正式 地 ， 这 可 以 用 简单 的 pop-and-if->0-goto 来 表达 。 正 式 地 ， 这 个 特定 操作 的 助 记 符 
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是 ifgt。 将 循环 正式 转换 到 jasmin， 结 果 如 图 4-4 所 示 。 


1dc 100 ; 装 和 人 整数 100 (循环 次 数 ) 

istore_1 ; 将 索引 作为 整数 存储 到 #1 
LoopTop: 

; 做 一 些 特别 聪明 的 事情 

; 使 用 所 需要 的 局 部 变量 

i1oad_1 ; 从 # 重 新 装 人 循环 索引 

iconst_ml ; 装 人 -1， 用 于 减法 


iadd ; 循环 索引 递减 

istore_l ; 存储 ... 

iload_1 ; . .并 重新 装 和 人 循环 索引 

ifgt LoopTop ;如 果 堆 栈 顶 部 >0， 就 将 LoopTop 放 入 PC 
; 并 重复 


不 再 循环 





图 4-4 一 个 用 jasmin 写 的 〈 儿 乎 ) 等 价 的 循环 示例 


实际 上 ， 这 不 是 一 个 完全 准确 的 转换 。 只 要 循环 索引 的 初始 值 大 于 0， 它 就 会 正常 运行 。 然 
而 ， 如 果 程 序 员 规 定 的 循环 起 始 值 是 负数 (如 for (i=-1; i>0; i++))， 则 用 Java 或 C++ 写 的 循环 将 
永远 不 会 执行 。jasmin 版 本 仍 能 执行 一 次 ， 因 为 在 计算 机 有 机 会 检测 索引 是 否 足够 大 之 前 ， 做 陪 
明 事 情 的 计算 已 经 执行 了 。 更 准确 的 转换 需要 更 巧妙 或 者 至 少 更 有 变化 性 的 判定 和 goto 语 句 。 


4.2 goto 的 类 型 


4.2.1 无 条 件 转移 

最 简单 形式 的 goto 就 是 无 条 件 转移 (unconditional branch) ，( 就 是 goto 语 句 ) ， 该 语句 总 
是 简单 地 将 控制 转移 给 被 指定 为 参数 的 标号 。 该 语句 本 身 能 产生 无 限 循 环 (永远 运行 的 循环 )， 
而 不 是 只 运行 一 段 时 间 然 后 在 某 些 情况 改变 后 就 中 止 的 循环 。 为 此 ， 程 序 员 就 需要 条 件 转移 
(conditional branch) ， 就 是 可 能 发 生 也 可 能 不 发 生 的 转移 。 


4.2.2 条 件 转移 。 

JVM 支 持 6 种 基本 的 条 件 转移 (有 时 称 为 “条 件 goto”)， 再 加 上 若干 种 便捷 操作 和 另外 两 
个 转移 〈 将 在 后 面 与 类 /对 象 一 起 描述 ) 。 一 个 基本 的 条 件 转移 是 通过 从 堆栈 中 弹出 一 个 整数 ， 
然后 确定 这 个 弹出 的 整数 是 大 于 、 小 于 还 是 等 于 0。 如 果 所 期 望 的 条 件 满足 ， 控 制 就 转移 到 指 
定 的 标号 。 否 则 ，PC 像 往常 一 样 递增 并 将 传递 到 下 一 条 语句 。 用 3 种 可 能 的 比较 结果 (大 于 0、 
小 于 0 或 等 于 0)， 就 能 指定 所 有 7 种 有 意义 的 组 合 。 这 些 在 表 4-1 中 做 了 总 结 。 注 意 goto 语 名 不 
改变 堆栈 ， 而 if?? 操 作 都 弹出 单个 整数 。 


表 4-1 jasmin 中 的 条 件 和 无 条 件 转移 操作 


助 记 符 top>0 top=0 top<0 解释 

ifeq x 如 果 等 于 就 goto 

ifne Xx X 如 果 不 等 于 就 goto 

ifit X 如 果 小 于 就 goto 

ifge xX X 如 果 大 于 或 等 于 就 goto 
itgt x 如 果 大 于 就 goto 

ifle X Xx 如 果 小 于 或 等 于 就 goto 


(goto) X X Xx (总 是 goto) 


64 淄 一 部 分 假想 计 滤 机 


4.2.3 比较 操作 

如 果 基 本 条 件 转 移 只 在 整数 上 操作 ， 那 么 如 何 完 成 其 他 类 型 的 比较 ?其 他 类 型 的 比较 是 
通过 定义 成 返回 整数 的 比较 操作 来 完成 的 。 例 如 ， 操 作 1cmp 弹 出 两 个 长 整数 ( 像 往 常 一 样 ， 
两 个 长 整数 存 成 四 个 玲 栈 元 素 ) ， 并 根据 第 一 个 元 素 是 否 大 于 、 小 于 或 等 于 第 二 个 元 素 (就 是 
堆栈 顶部 的 元 素 ) 而 压 人 1、0 或 者 一 1。 例 如 ， 下 面 的 代码 片断 就 将 存 成 长 整数 的 局 部 变量 #3 
与 数 1 进行 比较 ， 当 且 仅 当 存储 的 值 较 大 时 就 将 控制 转移 到 Somewhere: 

11oad_3 ; 装 人 局 部 变量 #3 (及 #4) 

1]const_1 ; 将 1 作为 为 长 整 和 用 于 比较 

Tcmp ; 比较 大 小 ， 整数 解 

ifgt Somewhere ; 如 果 #3>1， 懂 全 二 政 解 。。 

4 如 果 运 行 到 了 这 里 ， 则 #3 《=1 


在 堆栈 按 序 操作 中 有 非常 重要 的 一 点 。 指 令 序列 110ad_1、1110ad_3、1cmp 将 首先 压 人 局 
部 变量 #1/#2， 接 着 压 人 #3/#4， 然 后 再 做 比 
较 。 比 较 操作 对 顺序 是 敏感 的 ， 如 果 是 #1/#2 mp 
在 堆栈 的 顶部 ， 就 会 给 出 一 个 不 同 的 结果 。 | 如 则 结果 为 1 
要 记 住 这 个 次 序 ， 只 要 这 样 想 ， 从 堆栈 顶部 
第 二 个 元 素 碱 去 堆栈 顶部 元 素 。 压 人 的 结果 
就 是 这 个 差 的 符号 (+1、0 或 1)。 见 图 4-5 
的 例子 。 

比较 浮 点 数 和 双 精 度数 是 类 似 的 ， 但 因为 IEEE 表 示 的 复杂 性 ， 使 这 个 问题 有 点 床 手 。 具 
体 说 ， 就 是 IEEE 754 允 许 用 某 种 特殊 的 位 模式 来 表示 “不 是 一 个 数 "， 简 写 为 NaN。 这 些 特 殊 
的 模式 在 实质 上 意味 着 先前 在 某 处 的 计算 是 完全 错误 的 (如 试图 对 复数 求 平方 根 或 者 用 0 除 0) 。 
通常 与 NaN 进 行 比较 没有 意义 ， 但 程序 员 有 时 有 一 个 特殊 的 解释 。 

例如 ， 假 设 一 个 学 院 定义 一 个 优等 生 列表 ,包括 了 所 有 平均 分 (grade point average， gpa) 
在 3.50 以 上 的 学 生 。 为 了 确定 一 个 学 生 是 否 在 这 个 优等 生 列 表 中 ， 用 Pascal 编 写 的 一 个 简短 各 
序 片断 如 下 所 示 : 


if (gpa > 3.50) then 
onhonerslist := true; 


一 个 没有 gpa 的 学 生 (例如 ， 第 一 学 期 的 学 生 或 因 病 各 科 都 未 完成 的 学 生 ) 将 不 可 能 在 优 
等 生 列表 的 考虑 之 肉 。 换 句 话说， 如 果 一 个 学 生 的 gpa 为 NaN， 将 被 视 作 小 于 3.50。 然 而 ， 这 
个 学 生 不 应 因 gpa 太 低 而 被 开除 。NaN 应 该 比 适当 的 下 限 分 数 高 。JTVM 和 jasmin 提 供 了 两 个 不 
同 的 比较 指令 来 定义 这 些 情况 。 指 令 fcmpg 比 较 堆 栈 顶 部 的 两 个 浮 点 数 ， 并 根据 结果 将 1、0 
或 -1 压 入 , 例外 情况 是 车 两 个 数 中 有 NaN， 则 结果 是 1。 而 车 两 个 数 中 有 NaN，fcmp1 则 返回 一 1。 
同样 ， 比 较 两 个 双 精 度数 的 类 似 指 令 是 dcmpg 和 dcmp1， 这 两 个 指令 的 行为 也 存在 类 似 差异 。 
上 面 Pascal 片 断 的 jasmin 等 价 程序 大 致 如 下 : 


图 4-5 lcmp 指 令 示意 图 


fload_l ; 从 大 作为 浮 点 数 装 入 gpa 

1dc 3.50 ，; 装 入 gpa 下 限 分 数 (3.50) 

femp] ， 将 gpa 与 下 限 分 数 比 较 ，NaN 是 “ 低 ” 
ifle Skip  ”， 转 到 Skip，gpa>》= 下 限 分 数 
iconst_1 ; 压 人 1 (布尔 值 : true ) 


iconst_2 ; 将 “true” 放 人 到 #2 (作为 整数 /布尔 数 ) 
Skip: ; 做 需要 对 该 学 生 做 的 其 他 事情 
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4.2.4 组 合 操作 
如 前 所 述 ， 像 短 整数 和 布尔 数 这 样 的 二 类 类 型 并 未 直接 得 到 支持 ， 在 计算 中 必须 作为 整 
数 类 型 看 待 。 更 奇怪 的 是 , jasmin 没 有 提供 一 种 方式 来 计算 比较 两 个 整数 的 结果 ! 替代 方法 是 ， 
比较 是 通过 一 些 将 比较 操作 与 内 置 的 条 件 转移 相 结 合 的 快捷 操作 来 完成 的 (如 表 4-2 所 示 )。 


表 4-2 在 jasmin 中 比较 /转移 指令 的 组 合 
8. 


if_icmpeq 如 果 第 二 个 元 素 等 于 栈 顶 元 素 则 转移 
if_icempne 如 果 第 二 个 元 素 不 等 于 栈 顶 元 素 则 转移 

让 icmplt 如 果 第 二 个 元 素 小 于 栈 顶 元 素 则 转移 

if_ icmpge 如 果 第 二 个 元 素 大 于 或 等 于 栈 顶 元 素 则 转移 
if_icempgt 如 果 第 二 个 元 素 大 于 栈 顶 元 素 转移 
if_icmple 如 果 第 二 个 元 素 小 于 或 等 于 栈 顶 元 素 则 转移 


所 有 这 些 操作 的 原理 差不多 是 一 样 的 。CPU 首 先 从 栈 中 弹出 两 个 int 型 元 素 ， 然 后 像 icmp 
指令 那样 进行 比较 ， 而 比较 结果 不 是 压 人 栈 中 ， 而 是 程序 通过 修改 程序 计数 器 立即 跳 到 (或 
不 跳 ) 接近 的 位 置 。 


4.3 建立 控制 结构 


在 高 级 语言 中 ， 控 制 结构 的 主要 优势 是 相对 来 说 容易 理解 。 在 〈JVM 或 任何 其 他 计算 机 
上 ) 进行 汇编 语言 编程 时 尽量 最 大 程度 地 保持 这 种 易于 理解 性 也 是 有 益 的 。 这 样 做 的 一 种 方 
法 就 是 维护 一 个 类 似 的 代码 逻辑 块 结构 ， 像 高 级 控制 结构 一 样 组 织 。 


4.3.1 if 语 铝 
对 4.2.3 节 关于 在 jasmin 中 如 何 表 达 高 级 控制 的 例子 进行 扩展 ， 编 号 无 错误 和 易 理 解 代 码 
的 关键 是 保留 一 个 类 似 的 模块 结构 。 传 统 的 if/then 语 句 有 至 多 三 个 部 分 : 一 个 布尔 表达 式 ， 读 
表达 式 求 值 为 真 时 要 执行 的 一 组 语句 ， 为 假 时 要 执行 的 另 一 组 语句 。 这 个 C++ 或 Java 块 是 : 
if (a > 5) { 
// ” (iE 模块) 
// 做 一 些 事情 
// 需要 几 行 
// (else 模 块 ) 


// 做 其 他 一 些 事情 
// 需要 儿 行 


// 做 需要 做 的 其 他 任何 操作 


上 述 模 块 可 用 jasmin 写 成 如 下 等 价 的 模块 (假设 a 是 在 #1 中 的 一 个 长 整数 型 )， 


11load_1 ; 如 果 a 在 #1 中 
ldc.25 ， 装 人 5 


Tcmp ; 比较 a 和 5 
ifle Else 


;如果 运 行 到 了 这 里 ， 则 a > 5， 因 而 执行 的 是 if 子 句 
， 从 首 多 结 下 壮 过 el 还 

5 -~-- 这 对 应 于 前 面 的 1 模块 

goto Quit 


Else: 
“” ， 如 果 运行 到 了 这 里 ， 则 a <= 5， 因 而 执行 的 是 el1se 子 名 


，- 一 -这 对 应 于 前 面 的 e1se 模 块 
”， 做 需要 做 的 其 他 操作 
，---- 这 对 应 于 前 面 if 语 句 后 面 的 语句 


} else { 


} 


Quit 
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这 个 代码 和 高 级 代码 之 间 在 模块 结构 上 的 相似 性 应 该 是 显然 的 。 特 别 是 ， 在 两 个 代码 示 
例 中 都 有 相对 于 if 模 块 和 else 模 块 的 连续 的 指令 ， 这 些 指令 按 序 从 头 至 尾 执行 。jasmin 在 这 些 
模块 之 间 插入 代码 并 按 此 设置 PC。 在 细节 上 ， 要 注意 这 个 例子 中 的 测试 有 点 不 同 ， 即 在 条 件 
的 反面 成 立时 ， 不 是 直接 转移 到 if 子 句 ， 而 是 跳 过 if 子 句 (到 else 子 句 )。 

复杂 的 布尔 条 件 可 通过 适当 地 使 用 iand、ior 以 及 其 他 指令 , 或 者 通过 反复 的 组 合 来 解决 。 
例如 ， 我 们 可 用 如 下 程序 来 检验 a 是 否 处 于 5 和 10 之 间 (a>5 且 a<10) 的 范围 ， 

11oad_1 ”， 如 果 a 在 #1 中 


1dc-2 5  ， 装 入 5 


lemp ， 比较 a 和 5 

ifle Else 

; 如 果 运 行 到 了 这 里 ， 则 a>5 
11oad_1 ”; 如 果 a 在 #1 中 

1dc_2 10 ， 装 和 人 10 

Tcmp ; 比较 a 和 10 

ifge Else 

3 和 如果 运行 到 了 这 里 ， 则 a>5 且 a<10 


; 程序 如 前 继续 


4.3.2 循环 
在 很 多 编程 语言 中 有 两 类 基本 的 循环 : 程序 在 开始 时 测试 条 件 的 循环 和 测试 在 结尾 测试 
条 件 的 循环 。 第 二 种 已 举例 说 明 。 我 们 保留 循环 的 内 部 模块 结构 ， 在 模块 的 顶端 置 一 个 标号 ， 
然后 在 条 件 不 能 使 循环 退出 时 跳 回 到 这 个 顶端 。 程 序 大 致 如 下 : 
LoopTop: “ ， 完 成 与 循环 相关 的 操作 
ji1oad_1 ; 装 人 要 比较 的 第 一 个 操作 数 
iconst_ml ，; 装 入 要 比较 的 第 二 个 操作 数 
ifne LoopTop ， (该 循环 持续 进行 直至 #1= 一 1) 
; 结束 循环 | 
这 个 程序 实现 的 就 是 Pascal 中 的 repeat 循 环 ， 或 者 是 C、C++ 或 Java 中 的 do/whi1e 循 环 。 
对 于 更 传统 的 whi1e 循 环 ， 条 件 置 于 循环 体 的 前 面 ， 循 环 体 后 跟 一 个 无 条 件 goto。 如 果 循 环 退 
出 条 件 满足 ， 控 制 就 被 转移 到 循环 外 的 首 条 语句 ， 如 下 所 示 : 


Control: 
iload_1 ; 装 入 比较 的 第 一 个 操作 数 
iconst_ml ; 装 入 比较 的 第 二 个 操作 数 
ifeq LoopOut ， (该 循环 持续 进行 直至 #1= 一 1) 
， 完成 与 循环 相关 的 操作 
goto Control] ， 循环 后 ， 跳 转 并 重新 检测 条 件 
LoopOut : ， 你 只 能 通过 上 面 的 条 件 转移 运行 到 这 里 


这 个 代码 片断 执行 的 是 与 while (i != 1) 等 价 的 循环 。 还 可 以 采取 另外 一 种 方式 ， 就 
是 保持 do/while 结 构 ， 但 在 底部 通过 一 个 无 条 件 转移 进入 循环 ， 如 下 所 示 ， 
goto LoopEnd ， 直接 跳 转 到 循环 测试 
LoopTop: ”， 完 成 与 循环 相关 的 操作 
LoopEnd: 
iload_1 ; 装 和 比较 的 第 一 个 操作 数 
iconst_m1 ， 装 入 比较 的 第 二 个 操作 数 
ifne LoopTop ， (该 循环 持续 进行 直至 #1= 一 1) 
; 结束 循环 


这 就 节省 了 一 条 goto 语 句 的 执行 。 
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whiTe 和 for 循 环 的 等 价 性 已 众所周知 。 一 个 由 计数 器 控制 的 循环 如 下 所 示 ; 
for (i=0;i<10;i++) 
// 做 一 些 事 情 
该 循环 等 价 于 : 
whi1e’ Cic10) { | 
// 做 一 些 事情 “ 
1++; 
} 
这 样 也 就 能 容易 地 用 上 面 的 框架 写 出 。 最 重要 的 改变 是 需要 用 一 个 局 部 变量 作为 计数 器 ， 
要 不 是 这 一 点 不 同 ，whi1e 结 构 就 几乎 是 完全 重复 的 。 


bipush 0 ; 采用 #1 作为 1， 初 始 时 设 为 零 

istore_1 

goto LoopEnd ， 直 接 跳 转 到 循环 测试 
LoopTop: 

; 完成 与 循环 相关 的 操作 

; #1 递 增 

iload_1 ;从 #1 中 装 入 i 

iconst_1 ; 装 人 1， 用 于 递增 

iadd ， 我 们 现在 已 经 完成 了 i4+ 

istore_1 ; ..。 并 将 i 存 入 到 #1 (再 一 次 ) 

; 为 提高 效率 ， 上 面 四 行 可 用 一 个 操作 代替 : iinc 1 1 
LoopEnd : 


ioad_1 ， 装 入 比较 的 第 一 个 操作 数 (i) 
bipush 16 。 ， 装 入 比较 的 第 一 个 操作 数 (10) 
ifle LoopTop ， (该 循环 持续 进行 直至 机 = 一 1) 
， 只 有 当 #1 >= 10 时 结束 循环 


4.3.3 转移 指令 的 细节 

从 程序 员 的 角度 看 ， 采 用 goto 语 句 和 标号 是 相当 简单 的 。 在 你 希望 控制 跳 转 到 的 地 方 加 
一 个 标号 ， 程 序 就 自动 地 跳 转 到 那里 。 在 简单 的 外 表 下 ， 其 内 部 的 实现 却 更 复杂 一 些 。 计 算 
机 实际 上 存储 的 不 是 标号 ， 而 是 偏 移 (offset) 。 例 如 ， 在 字 节 码 中 ，goto 指 令 (操作 代码 
0xA7) 后 接 一 个 带 符号 的 2 字 节 ( 短 ) 整数 。 这 个 整数 就 是 用 作为 程序 计数 器 的 改变 量 。 换 
句 话 说， 该 指令 执行 后 ，PC 的 值 就 变 为 PC + offset。 如 果 偏 移 值 是 负数 ， 其 效果 就 是 将 控制 
移 回 到 以 前 运行 过 的 语句 (就 像 前 面 的 重复 循环 的 例子 中 所 示 )， 而 如 果 偏 移 值 是 正 数 ， 程 序 
就 向 前 跳 (就 像 if/then/ye1se 例 子 中 所 示 ) 。 在 理论 上 ， 用 值 为 0 的 偏 移 是 完全 可 以 的 ， 但 这 
意味 着 该 语句 没有 改变 PC， 因 此 会 产生 无 限 循环 。 一 个 为 0 的 偏 移 对 应 于 下 面 的 jasmin 语 句 ， 

Self: 

goto Self 

这 也 许 不 是 程序 员 想 要 的 。 

那么 ， 程 序 员 是 如 何 计算 这 些 偏 移 的 呢 ? 幸运 的 是 ， 他 根本 就 不 用 计算 。 这 是 jasmin 之 
类 的 汇编 器 的 任务 也 是 它 的 主要 优势 。 程 序 员 只 要 简单 地 使 用 就 可 以 了 ， 确 定 偏 移 应 该 是 多 
少 是 汇编 器 的 任务 。 对 于 这 种 实现 还 有 一 个 潜在 的 更 严重 的 问题 〈 仍 以 程序 员 的 角度 看 ) ， 就 
是 只 有 2 个 字 节 的 (有 符号 ) 偏 移 ， 不 可 能 有 比 大 约 32 000 字 节 更 长 的 跳 转 (在 前 后 方向 上 都 
是 如 此 )。 对 于 确实 长 的 程序 会 出 现 什么 情况 呢 ? 

这 在 jasmin 中 用 两 种 方式 解决 。 首 先 ， 除 了 goto 指 令 以 外 ， 还 提供 一 个 goto_w 指 令 (有 
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时 称 为 “ 宽 goto”， 实 现成 为 操作 代码 0xC8)。 它 在 多 个 方面 都 类 似 于 常规 的 goto， 但 后 跟 一 
个 更 长 的 整数 ， 使 得 程序 员 能 前 跳 或 后 跳 多 达 20 亿 字 节 左右 。 由 于 单独 的 JVM 方 法 不 允许 大 
于 2 《大约 64 000) 字 节 长 ， 如 果 你 写 了 一 个 更 长 的 方法 ， 或许 就 要 将 其 分 成 若干 个 部 分 ， 
这 个 新 的 操作 代码 解决 了 这 个 问题 。 当 遇 到 像 goto Somewhere 的 语 名 时， 决定 用 什么 操作 代 
码 仍然 是 汇编 器 的 工作 ， 它 可 用 0xA7 或 者 0xC8 指 令 。 如 果 需 要 的 偏 移 过 大 ， 不 能 装 到 短 整数 
中 ， 就 自动 将 程序 员 的 goto 转 换 成 机 器 内 部 的 goto_w。 

一 个 更 严重 的 问题 是 不 存在 对 应 ifne_w 的 直接 对 等 指令 或 者 其 他 宽 的 条 件 转移 指令 。 然 
而 ， 汇编 器 仍 能 在 无 需 程序 员 的 知识 或 合作 的 情况 下 设计 出 等 价 功 能 。 一 个 转移 到 遥远 位 置 
的 宽 条 件 转 移 的 功能 可 用 一 个 “ 绕 过 转移 的 转移 ”的 方法 来 模拟 ， 如 图 4-6 所 示 。 

; 真正 需要 的 是 “ifne DistantLocation” 
; 但 由 于 太 远 ， 不 能 在 单 步 达到 


不幸 的 是 ， 不 存在 ifne_w 
; 汇编 器 会 实现 这 个 功能 


ifeq Skip ; 注意 测试 的 是 相反 情况 
goto_w DistantLocation  ， 因 为 我 们 在 线 过 转移 
; 做 其 他 一 些 事 情 





图 4-6 一 个 “ 绕 过 转移 的 转移 ”的 例子 ， 即 有 条 件 地 跳 转 到 遥远 的 位 置 


就 像 计 算 转 移 大 小 一 样 ， 一 个 好 的 汇编 器 对 于 这 种 情况 总 有 正确 的 做 法 。 
使 用 转移 语句 的 最 严重 的 问题 是 它们 没有 以 任何 方式 为 程序 员 提供 局 部 模块 结构 。 很 多 
程序 员 依 赖 于 能 在 模块 内 重新 定义 局 部 变量 的 便利 ， 如 下 所 示 ， 
if (x > 0) { 
int x; // 这 是 一 个 新 的 x， 与 以 前 的 无 关 


x = -1; 


]/ 这 里 ， 旧 的 x 重新 出 现 并 重新 请 求 其 旧 值 
在 汇编 语言 中 没有 这 种 便利 性 。 所 有 的 局 部 变量 (以 及 堆栈 ) 在 跳 转 之 前 、 期 间 、 之 后 
都 保留 其 值 。 如 果 在 跳 转 前 ， 一 个 重要 的 变量 存储 在 #2， 而 下 一 条 语句 是 fstore_2， 则 该 重 
要 变量 将 被 重 写 。 模 块 结构 对 于 如 何 考虑 汇编 语言 程序 是 一 个 重要 的 便利 ， 但 它 没有 提供 像 
信息 隐藏 等 任何 实际 的 防范 措施 以 避免 错误 和 误 用 。 


4.4 示例 ， Syracuse 数 


4.4.1 问题 定义 

作为 一 个 将 这 些 内 容 结 合 到 一 起 的 例子 ， 我 们 将 探讨 Syracuse 数 ( 即 3N+1) 猜想 
问题 可 追 诗 到 古典 数学 ， 一 个 十 希腊 人 注意 到 一 些 简 单 的 算术 规则 会 产生 惊人 的 、 不 和 
的 行为 ， 这 些 规则 是 : 

。 如 果 数 N 是 1， 则 停止 。 

。 如 果 数 N 是 奇数 ， 则 将 NN 变 为 3N+1， 并 继续 。 

。 如 果 数 N 是 偶数 ， 则 将 N 变 为 W2， 并 继续 。 

人 们 在 早期 发 现 ， 若 你 从 任何 一 个 正 整数 开始 进行 ， 这 个 过 程 看 起 来 总 会 停止 (到 达 1)， 
但 没有 人 能 实际 地 证 明 这 个 猜想 。 进 一 步 地 说 ， 没 有 人 能 发 现 一 个 一 般 的 规则 以 预测 需要 多 
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少 步 才能 到 达 1。 有 时 这 个 过 程 恰 巧 非 常 快 ， 
16 一 8 一 4 一 2 一 1 
但 相近 的 数字 可 能 需要 不 同 的 次 数 ， 
15— 46 一 23 一 70 一 35 一 106 一 53 一 160-*80-， 
40 一 20 一 10 一 5 一 16 一 8 一 4 一 2 一 1 

有 时 需要 非常 大 的 次 数 。 甚 至 在 目前 ， 也 没有 人 知道 需要 多 少 步 ， 甚 至 是 否 总 是 到 达 1 
(虽然 数学 家 采用 计算 机 已 经 发 现 所 有 小 于 几 十 亿 的 数 都 会 收敛 到 1)。 你 自己 试 着 做 一 下 : 从 
81 开 始 ， 你 认为 需要 多 少 步 才能 到 达 1? 
4.4.2 设计 

更 好 的 办 法 是 不 用 你 自己 去 做 ， 而 是 让 计算 机 做 这 件 事情 。 图 4-7 给 出 了 针对 开始 于 81 直 
至 到 达 1 的 算法 的 伪 代 码 。 用 jasmin 实 现 这 个 算法 就 会 快速 得 出 这 个 猜想 的 答案 。 


count_of_steps <- 0 
current_value <- 81 
while (current_value != 1) 
if (current_value is odd) 
Current_value <- {current_value * 3) + 1 


else 
current_value <- (current_value / 2) 
endif 
Count_of_steps <- count_of_steps + 1 
endwhile 
final answer is count_of_steps 





图 4-7 用 擅 代 码 测试 Syracuse 猜 想 


图 4-7 中 的 代码 需要 两 个 整数 变量 ， 为 计算 简单 ， 我 们 将 它们 看 作 整 数 类 型 (而 不 是 长 整 
数 ) 。 特 别 是 ，count_of_steps 可 存储 为 局 部 变量 #1 ， 而 current_value 可 被 存储 为 局 部 变量 
#2。 步 骤 1、2、5、7、9 的 算术 运算 可 用 第 二 章 的 技术 来 执行 。 第 11 行 的 输出 可 用 车 于 种 方式 
完成 。 这 里 我 们 选择 较 简单 的 一 种 ， 就 是 只 打印 最 终结 果 。 

从 第 4 到 第 8 行 用 到 的 if/else 结 构 可 用 第 4.3.1 节 的 代码 块 来 建 模 。 特 别 地 ， 我 们 可 用 除 以 2 
取 余 数 (irem) 的 方法 来 确定 当前 值 是 否 是 奇数 。 如 果 结 果 等 于 0 (if_icmpeq)， 则 该 数 是 
偶数 。 图 4-8 中 的 代码 显示 出 这 一 点 。 作 为 典型 的 结构 化 程序 设计 ， 从 整体 上 看 ， 这 个 模块 在 
起 始 语句 有 单个 入 口 ， 在 底部 有 单个 出 口 (标记 为 Exit: 的 那 一 点 )。 

;if/else 的 入 口 点 


iload_2 ; 装 和 current_value 


iconst_2 ， 还 有 2， 以 确定 奇偶 性 


irem ; 计算 余数 
Tconst_0 ; 比较 余数 与 0 
if_icmpgt Case0dd， 如 果 是 奇数 ， 就 转 到 Case0dd 


CaseEven: ; 从 技术 上 说 ,我 们 不 需要 这 个 标号 


; 因为 永远 不 会 转移 到 这 个 位 置 


5 将 #2 除 以 2 并 重新 存储 
iload_.2 ; 装 人 当前 值 
iconst_2 ; 压 入 2 用 于 除 
idiv ， 做 除法 


istore_2 并 压 和 人 新 值 
图 4-8 Syracuse 数 计算 代码 内 部 模块 的 ifyelse 结 构 
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goto Exit 1 跳 过 Case0dd 模 块 
Case0dd : 
; 将 #2 乘 以 3 并 加 1 
iload_2 ， 装 入 当前 值 
iconst_3 ; 讨 人 3 用 于 乘 
imul ; 做 乘法 (现在 存储 的 值 就 是 3*N) 
iconst_1 ; 压 人 1 用 于 加 
iadd ; 做 加 法 (存储 的 值 就 是 3*N+1) 
istore_2 ， 并 将 新 值 存 起 来 
Exit: 
; if/else 分 支 的 共同 出 口 点 
图 4-8 ( 续 ) 
全 部 的 代码 块 将 用 于 while-loop 结 构 的 内 部 ， 如 图 4-9 所 示 。 


+ whi1e 的 入 口 
LoopEntry: 
iload_2 ;从 #2 中 装 入 current_value 


iconst_1， 将 current_value 与 1 比较 
if_icmpeq ~ LoopExit ， 如 果 相等 就 转移 到 LoopExit 


; 做 奇偶 计算 的 必要 语句 


; 递增 count_of_steps 的 必要 语句 


goto LoopEntry ， 无 条 件 转移 到 循环 的 顶部 
; 并 重新 检测 


LoopExit: 
; whi1e 循 环 的 出 口 点 





图 4-9 Syracuse 数 计算 代码 主 循环 的 while 结 构 


4.4.3 解答 与 实现 
这 里 给 出 了 完整 的 解答 


; 样板 

.method public <init>OV 
aload_6 
invokespecial java/lang/Object/<init>OV 
return 

.end method 


.method public static main([Ljava/lang/String;)V 


.1imit stack 2 ; 这 里 没有 复杂 的 计算 
.Timit locals 3 ; #0 是 保留 的 (通常 情况 ) 
; #] 是 循环 计数 器 


; #2 是 N 的 值 


iconst_0 #1 <- 0 
istore_] 


bipush 81 } #2 <- 81 
istore_2 
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LoopEntry: 
iload_2 ; 从 #2 装 入 current_value 


iconst_1 ; 和 将 current_value 与 1 比较 
if_icmpeq LoopExit ; 如 果 相 和 等， 就 转移 到 LoopExit 


; 做 一 些 奇偶 计算 所 必要 的 语句 

; if/else 的 入 口 点 
iload.2 ; 装 入 current_value 
iconst-? ， 还 有 2 ， 以 确定 奇偶 性 


irem ; 计算 余数 
iconst_0 ; 将 余数 与 0 比较 
if_icmpgt Case0dd ; 如 果 是 奇数 ， 则 转移 到 Case0dd 


; 只 有 #2 是 偶数 时 我 们 才能 到 这 里 

; 将 #2 除 以 2 并 重新 存储 

il1oad_2 3 装 人 当前 值 
iconst 2 ; 压 人 2 用 于 除 
idiv ; 做 除法 
istore_2 ; 存储 新 值 


goto Exit ; 跳 过 Case0dd 模 块 
Case0dd : 
将 #2 乘 以 3 再 加 1 
iload_2 ， 装 入 当前 值 
iconst_3 压 人 3 用 于 乘 
imu] 做 乘法 (现在 存储 的 值 是 3*N) 


iconst._] ， 压 人 1 用 于 加 
iadd ; 做 加 法 (存储 的 值 是 3*N+1) 
; 并 存储 新 值 


istore_2 


Exit: ; 执行 递增 count_of_steps 的 必要 语句 
iinc 11 ， 递增 循环 索引 


goto LoopEntry ; 无 条 件 转移 到 顶部 ， 并 重新 检测 


LoopExit: 
; 打印 结果 到 System.out (通常 如 此 ) 
getstatic java/lang/System/out Ljava/io/PrintStream; 
iload 1 ; 装 入 循环 计数 器 用 于 打印 
invokevirtual java/io/PrintStream/print1n(I)V 


return 
.end method 





4.5 表 跳 转 


多 数 高 级 语言 还 支持 多 路 判定 的 概念 ， 这 在 Java 中 表示 成 一 个 switch 语 句 。 作 为 这 种 多 
路 判定 的 使 用 示例 ， 请 看 一 个 试图 计算 一 个 月 中 有 多 少 天 的 程序 ， 如 图 4-10 所 示 。 

显然 ， 任 何 多 路 转移 都 能 以 一 组 两 路 转移 (如 if/else 语 句 ) 来 看 待 ， 并 据 此 编写 程序 。 
JVM 还 提供 了 一 个 快捷 方式 (事实 上 是 两 个 快捷 方式 ) ， 使 得 在 某 些 条 件 下 代码 执行 得 更 简单 
更 快速 。 主 要 的 条 件 就 是 : 分 支 (case) 标号 (例如 ， 就 是 在 前 面 例子 中 的 数字 1 到 12) 必须 
是 整数 。 

如 前 所 述 ， 没 有 直接 的 模块 结构 的 概念 。 机 器 提供 的 是 一 个 多 路 转移 ， 计 算 机 根据 堆栈 
顶部 的 值 ， 转 移 到 这 车 于 个 目的 地 之 中 的 一 个 。1ookupswitch 指 令 的 一 般 格式 包含 一 组 的 值 ; 
标号 对 。 如 果 值 匹配 堆栈 顶部 元 素 ， 则 控制 就 传递 到 该 标号 。 


switch (monthno) { 
// 九 月 、 四 月 、 六 月 、 及 11 月 有 30 天 
case 9 : 
Case 4 : 


case 6 : 
case 11 : days = 30; break; 


// .所 有 其 他 月 份 都 有 31 天 


case 1 : case 3 : case 5 : case 7 : case 8 : case 10 : case 12: 
days = 31; break; 
// 唯 独 除了 二 月 以 外 〈 不 考虑 闽 年 ) 
case 2 : days = 28; break; 
default : System.out ,println(+Error : Bad month!"); 
上 V/ switch 结束 





图 4-10 在 Java 和 C 语 言 中 的 多 路 转移 语句 


iload._1 ; 假设 "monthno" 在 储 在 #1 中 
1ookupswitch ; 多 路 转移 开始 
工 : Days31 ; 
: Days28 ; 
3 : Days31 ; 
4 : Days30 ; 
5 : Days31 ; 
6 : Days30 ; 
7 : Days31 ; 
8 : Days31 ; 
9 : Days30 ; 
10 : Days31 ; 
11 : Days30 ; 
12 : Days31 ; 
default : ERROR ; 
Days28: 
bipush 28 ; 装 入 28 天 
istore—2 ; 并 分 配 到 天 (#2) 
goto ExampleEnd 
Days308: 
bipush 30 ; 装 人 和 人 30 天 
istore-2 ; 并 分 配 到 天 (#2) 
goto ExampleEnd 
Days31: 
bipush 31 ; 装 入 31 天 
istore_2 ; 并 分 配 到 天 (#2) 
goto ExampleEnd 
Error: 
;错误 发 生 时 完成 的 动作 ， 如 getstatic ,../System/out 
goto ExampleEnd 
ExampleEnd: 


; 做 必要 的 事情 


以 上 开始 于 1ookupswitch 并 结束 于 default 的 大 约 12 行 语句 实际 上 是 一 个 非常 复杂 的 机 
器 指令 。 与 其 他 已 经 讨论 过 的 语句 不 同 ， 这 条 指令 所 接受 参数 的 数量 是 变化 的 ， 因 而 jasmin 
汇编 器 (以 及 JVM 字 节 码 解释 器 ) 的 任务 相应 地 也 就 复杂 。 在 JVM 机 器 码 中 (与 在 Java 中 不 
同 ) ，default 这 个 分 支 是 必须 要 有 的 。 像 其 他 转移 语 名 一样 ， 存 储 的 值 是 相对 于 当前 程序 计数 
器 的 偏 移 。 与 多 数 其 他 的 语句 不 同 (除了 goto_w) ， 仿 移 被 存储 成 4 字 节 的 量 ， 使 得 在 方法 内 
能 跳 转 到 “遥远 ”的 位 置 。 

在 上 面 例子 中 ， 如 果 值 不 仅 是 整数 ， 而 且 是 连续 的 整数 ， 意 思 是 从 初始 值 (1，January ) 


~ 
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运行 直至 最 终 值 (12，December) 而 没有 中 断 或 跳 过 ， 这 样 的 话 ，JVM 就 提供 了 另 一 个 用 于 
多 路 判定 的 快捷 操作 。 该 思想 很 简单 ， 就 是 如 果 最 低 的 可 能 值 是 36， 则 下 一 个 值 就 是 37， 然 
后 是 38， 依 此 类 推 。 如 果 定 义 了 最 低 值 和 最 高 值 ， 其 余 的 值 就 可 像 表 一 样 填 充 。 因 此 ， 这 个 
操作 称 为 tableswitch， 使 用 方法 如 下 : 


iload_1 ;假设 "monthno" 在 储 在 #1 中 
tableswitch 1 12 + 开始 多 路 转移 ， 从 1 到 12 
Days3t ; 
Days28 
Days31 ; 
Days30 ; 
Days31 ; 
Days30 
Days31 
Days31 
Days30 
Days31 ; 
Days30 ; 
Days31 ; 
default : Error 
Days28: 
bipush 28 ; 装 入 28 天 
jstore-2 ;并 分 配 到 天 (#2) 
“goto ExampleEnd 
DayS30 : 
bipush 30 :5 装 人 30 天 


istore_2 ; 并 分 配 到 天 (#2) 
goto ExampleEnd 


bipush 31 ; 装 入 31 天 


istore_2 上 
goto ExampleEnd 4 并 分 配 到 天 (#2) 


， 错 误 发 生 时 完成 的 动作 ， 如 getstatic .../System/out 
; 并 打印 出 一 个 错误 信息 
goto Examp1eEnd 
ExampleEnd: “ 
， 做 必要 的 事情 


Days31: 


Error : 


补充 资料 
lookupswitch/tableswitch 的 机 器 码 
1ookupswitch 和 tab1eswitch 都 涉及 可 变数 量 的 参数 ， 因 而 在 字 节 码 中 就 有 复杂 的 实 
现 。 实 质 上 ， 存 在 一 个 关于 有 多 少 个 参数 的 “隐藏 的 ” 隐 仿 参数， 使 得 计算 机 知道 下 一 个 
参数 从 哪里 开始 。 
对 于 1ookupswitch 的 情况 ，jasmin 汇 编 响 将 为 你 统计 值 ， 标 号 对 的 数量 。 所 生成 的 


字 节 码 不 仅 包 含 100okupswitch 操 作 代码 (0xAB)， 还 有 一 个 4 字 节 用 来 对 非 default 分 支 进 
行 计数 。 每 个 分 支 存 储 成 4 字 节 整数 ( 值 )， 并 且 当 该 整数 匹配 堆栈 顶部 元 素 时 就 取得 相应 
的 4 字 节 偏 移 。 

对 于 tab1eswitch 的 情况 ， 什 可 通过 开始 和 最 终 值 计算 出 来 。 一 个 tab1eswitch 语 各 
在 内 部 存储 成 操作 代码 字 节 (0xAA)、 低 值 和 高 值 (存储 成 4 字 节 整数 ) ， 最 后 是 一 组 连续 
的 4 字 节 偏 移 (对 应 于 值 low、low 十 1、low+2，…high)。 两 个 指令 更 详细 介绍 见 附录 B。 





在 tableswitch 例 子 中 了 唯一 不 同 的 操作 是 tableswitch 本 身 。 其 余 的 代码 是 相同 的 。 重 要 
的 不 同 点 与 表 的 结构 相关 。 程 序 员 需要 定义 变量 可 取 的 最 低 值 和 最 高 值 ， 然 后 对 标号 从 小 到 
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大 排序 ， 而 不 是 明确 地 写 出 所 有 的 标号 : 值 对 。 这 些 都 是 由 表 结 构 自动 地 完成 的 。 在 上 面 的 
例子 中 ， 第 四 个 标号 (Day30) 是 自动 地 附 于 第 四 个 值 的 。 如 前 所 述 ， default 分 支 是 必须 要 
有 的 。 

当然 ， 这 些 跳 转 表 是 否 会 对 程序 的 效率 有 所 帮助 ， 要 看 具体 情况 和 其 体 问 题 。 一 个 switch 
语句 总 是 能 写成 一 组 适当 的 有 合适 复杂 条 件 的 if 语句 。 在 某 些 情 况 下 ， 计 算 一 个 布尔 条 件 比 枚 
举 各 种 情况 可 能 要 容易 一 些 。 


4.6 子 例 程 


4.6.1 基本 指令 
基于 分 支 兵制 的 一 个 主要 局 限 性 是 在 一 个 代码 块 被 执行 后 ， 它 将 自动 地 将 控制 转移 回 到 

一 个 不 可 改变 的 点 。 与 高 级 编程 语言 中 的 传统 过 程 不 同 ， 要 建立 一 个 代码 块 使 得 从 程序 中 任 
何 一 点 运行 然后 再 回 到 原来 的 地 方 ， 这 是 不 可 能 的 。( 见 图 4-11) 。 为 了 做 到 这 一 点 ， 需 要 更 
多 的 信息 以 及 新 的 控制 结构 和 操作 。 

; 做 一 些 事情 

; 做 一 些 事情 

goto UtilityProcedure ; 做 一 些 基本 的 实用 工具 子 例 程 


Part1lReturn 
， 利用 返回 值 做 一 些 事情 





Part2: ;做 一 些 事 情 
goto UtilitypProcedure ; 同一 个 基本 的 实用 工具 子 例 程 
Part2Return 


; 并 利用 该 返回 值 做 一 些 不 同事 情 


UtilityProcedure: 
- ; 从 堆栈 取 值 
; 并 执行 计算 


; 子 例 程 现 在 结束 
; 到 哪里 ? PartlReturn 还 是 Part2Return3? 
; 没有 办 法 做 这 个 决策 ! 





图 4-11 子 例 程 返回 问题 


需要 的 主要 信息 当然 是 控制 来 自 何 处 ， 因 为 该 位 置 要 作为 返回 点 。 这 需要 两 个 基本 的 修 
改 : 首先 ， 有 一 个 也 存储 (到 某 处 ) 跳 转 前 PC 值 的 转移 指令 ， 其次， 有 另 一 种 会 返回 到 一 个 
可 变 位 置 的 转移 指令 。 采 用 这 种 语义 写成 的 代码 块 通常 叫做 子 例 程 (subroutine ) 。 

JVM 提 供 一 个 jsr ( 跳 转 到 子 例 程 ) 指令 。 在 技术 上 ， 为 满足 这 个 需要 ， 它 提供 了 两 条 指 
令 ，jsr 和 jsr_w， 这 类 似 于 goto 和 goto_w。 当 jsr 指 令 执行 时 ， 控 制 被 立即 传递 (就 像 用 
goto 指 令 一 样 ) 到 标号 ,标号 的 偏 移 存储 在 字 节 码 中 。 在 此 发 生 之 前 ， 计 算 机 计算 出 值 (PC 
十 3)， 这 是 紧 接 着 jsr 指 令 本 身 的 下 一 条 指令 的 地 址 。 该 值 作为 一 个 常规 的 32 位 (4 字 节 ) 量 
被 压 入 到 堆栈 ， 就 在 此 时 控制 被 传递 到 标号 。 
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补充 资料 


jsr 的 机 器 语言 
为 了 确切 地 理解 指令 如 何 工 作 ， 让 我 们 详细 地 考察 jsr 指 令 的 机 器 码 。jsr 助 记 符 对 应 
于 单字 节 (0xA8)。jsr 后 接 一 个 2 字 节 的 偏 黎 ， 存 储 成 一 个 带 符号 的 短 整 数 。 假 设 存储 器 
位 置 0x1000 一 0x1003 存 储 了 如 表 4.3 的 模式 。 


表 4-3 jsr 指 令 的 字 节 码 结构 


位 置 0x1000 0x1001 0x1002 0x1003 
字 节 值 OxA8 0x00 0x10 0x3b 
解释 jsr Integer: 0x0010= 16 istore_0 


当 j sr 指令 执行 时 ，PC 将 有 值 0x1000 (根据 定义 ) 。 存 储 器 中 的 下 一 条 指令 
(istore_0) 存储 在 位 置 0x1003 。 


所 有 提供 子 例 程 调 用 的 机 器 也 提供 从 子 例 程 返回 的 指令 。 如 何在 基于 堆栈 的 计算 机 上 完 
成 这 一 点 是 相当 容易 理解 的 。 返 回 指令 将 会 检查 堆栈 顶部 并 使 用 存储 在 那里 的 值 ， 这 个 值 是 
由 jsr 指 令 压 入 作为 返回 的 地 址 。 这 个 位 置 就 成 为 一 个 隐 含 分 支 的 目标 地 址 ， 控 制 返回 到 主 程 
序 ， 计 算 继续 正常 运行 。 

在 JVM 上 事情 就 稍微 复杂 一 些 ， 主 要 是 安全 性 的 原因 。ret 指 令 不 检查 堆栈 以 获得 返回 位 
置 ， 而 是 接受 局 部 变量 数 作 为 一 个 参数 。 任 何 子 例 程 必须 执行 的 第 一 个 任务 就 是 将 jsr 指 令 
( 隐 含 地 ) 压 和 人 的 值 存储 到 一 个 适当 的 局 部 变量 中 。 做 完 这 件 事 之 后 ， 就 不 再 改变 这 个 位 置 。 i 
试图 对 存储 地 址 执行 计算 在 最 好 的 情况 下 也 是 危险 的 ， 通常 是 会 引起 误导 ， 而 在 Java 和 相关 
的 语言 中 则 是 完全 非法 的 。 这 也 是 安全 性 模型 和 验证 器 通常 要 避免 的 事情 。 


4.6.2 子 例 程 示例 让 | 

为 什么 要 用 子 例 程 rc] 昌 

子 例 程 的 一 种 常用 用 法 与 Java 方 法 或 C++ 过 程 很 类 
似 : 就 是 执行 一 个 特定 的 固定 任务 ， 而 这 个 任务 在 程序 
中 的 若干 个 位 置 都 可 能 需要 。 一 个 明显 的 例子 就 是 打印 
某 些 东西 。 正 如 我 们 在 前 面 的 一 些 例子 中 所 看 到 的 ， 诸 jx 位置 
如 打印 一 个 串 等 事情 可 能 相当 丈 手 , 需要 用 几 行 来 完成 。 
为 了 使 程序 更 容易 和 更 高 效 ， 一 个 熟练 的 程序 员 可 将 这 
些 行 做 成 一 个 子 例 程 模块 ， 并 用 jsr 和 ret 访 问 。 

子 例 程 Max (int A int B) 

让 我 们 从 一 个 算术 运算 子 例 程 的 简单 例子 开始 。 这 
个 简单 例子 计算 (并 返回 ) 两 个 整数 之 中 的 较 大 者 9 。 让 
我 们 假设 两 个 数 (作为 整数 ) 在 堆栈 上 ， 如 图 4-13 所 示 。 图 4-12 jsr 指 令 和 堆 本 














旨 当 jsr 指 令 执 行 时 ， 值 0x1003 (作为 地 址 ) 被 压 和 人 到 堆栈 ，PC 的 值 改变 为 0x1000+0x0010， 即 0x1010。 这 
意味 着 程序 将 向 前 跳 转 16 个 字 节 并 开始 执行 一 段 新 的 代码 。 当 ret 指 令 执行 时 ， 将 返回 位 置 0x1003 的 
iconst_0 指 令 。jsr_w 指 令 类 似 ， 只 不 过 它 涉及 4 字 节 的 偏 移 〈 因 而 可 进行 更 长 的 跳 转 ) ， 并 将 值 PC+5 压 
人 。( 见 图 4-12) 
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参数 1(A) 





图 4-13 max(A,B) 的 堆栈 结构 
if_icmp?? 指 令 将 为 我 们 做 适当 的 比较 ， 但 会 弹出 (并 销毁 ) 这 两 个 数 。 所 以 在 做 这 件 事 
之 前 ， 我 们 应 该 采用 dup2 复 制 堆栈 顶部 的 两 个 字 。 在 做 之 前 ， 所 有 子 例 程 必 须 处 理 返 回 地 址 。 
为 简单 起 见 ， 我 们 将 其 存储 到 局 部 变量 #1。 
; 假设 这 通过 jsr Max 来 调用 


， 两 个 整数 已 经 在 堆栈 上 
Max: 
astore_1 ;将 返回 地 址 存储 到 #1 
dup2 ; 拷贝 两 个 参数 以 备 后 用 
if_icmpgt Second ， 如 果 A<B， 则 转移 
First: 
5 > B， 所 以 需要 从 堆栈 中 删除 8 
po 
goto Exit 
Second: | 
5 £ B， 所 以 需要 将 A 交换 到 顶部 并 删除 它 
pop 、 
Exit: 


ret 1 ; 返回 到 存储 在 纪 的 位 置 
子 例 程 PrintString(String s) 
作为 第 二 个 例子 ， 我 们 将 写 (并 使 用 ) 一 个 子 例 程 ， 功 能 是 输出 一 个 固定 的 串 ， 该 串 被 
压 在 堆栈 上 。 让 我 们 首先 写 出 子 例 程 : 


;假设 这 通过 jsr PrintDream 调 用 
3 是 并 时 的 高 已 经 被 压 和 人 到 堆栈 
; 位 于 返回 地 址 下 面 


P tSt 
™" Seon ; 将 返回 地 址 存储 到 #1 


; 假设 要 打印 的 串 已 经 在 堆栈 上 


; 你 应 该 已 经 了 解 下 面 三 行 
getstatic java/1ang/System/out Ljava/io/ PrintStream 


swap ;将 参数 按 正确 的 顺序 放置 
invokevirtual java/io/PrintStream/printin(CLjava/lang/String;)V 


ret 1  ， 返回 到 存储 在 #1 中 的 位 置 


新 的 指令 astroe_1 是 ?store_hN 的 又 一 个 例子 ， 但 它 存储 的 是 一 个 地 址 (类 型 “a’ ) 而 不 
是 一 个 浮 点 数 、 双 精度 数 、 整 数 或 者 长 整数 。getstatic 和 invokevirtual 这 两 行 你 应 该 已 经 
熟悉 了 。 该 代码 假定 调用 环境 在 执行 跳 转 到 子 例 程 的 调用 之 前 已 将 串 压 人 ， 这 样 你 只 需要 压 
入 System.out 对 象 和 调用 必要 的 方法 。 一 旦 做 完 ，ret 指 令 就 使 用 新 近 存 储 到 #1 的 值 作为 返回 地 
址 。 然 而 ， 要 注意 仍 需 要 做 点 “信息 隐藏 ”或 模块 结构 的 工作 ， 因 为 这 个 子 例 程 会 不 可 挽回 
地 挫 毁 已 存储 在 局 部 变量 #] 中 的 任何 信息 。 如 果 程 序 员 想 要 采用 这 个 代码 模块 ， 他 就 需要 注 
意 这 个 行为 。 更 一 般 地 ， 对 于 任何 子 例 程 ， 重 要 的 是 要 知道 哪些 局 部 变量 是 子 例 程 用 到 的 和 


不 用 的 ， 因 为 它们 与 主 程序 所 使 用 的 是 同一 组 局 部 变量 。 
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使 用 子 例 程 


主 程序 可 写 得 任意 复杂 ， 并 可 能 涉及 对 该 子 例 程 的 多 次 调用 。 打 印 几 名 诗 怎么 样 ? 


; 压 人 要 打印 的 第 一 个 串 / 行 
1dc ”“Twas brillig, and the slithy toves" 
; 调用 在 Printstring 开 始 的 子 例 程 
jsr PrintString ， 这 行 以 后 马上 返回 
; 注意 不 需要 标号 
; 以 类 似 的 方式 继续 
ldc "Did gyre and gimble jn the wabe.". 
jsr PrintString 


ldc "All mimsy were the borogroves" 
jsr PrintString 


ldc "And the mome raths outgrabe." 
jsr PrintString 


; 永远 不 要 忘记 引用 诗 的 出 处 
ldc "(from Jabberwocky, by Lewis Carro11)" 


return ”， 退 出 方法 ， 因 为 我 们 已 经 打印 了 这 首 诗 
这 个 程序 的 一 个 完成 版 本 在 图 4-14 中 给 出 。( 实 际 上 ， 在 图 中 有 一 个 故意 的 错误 。 有 一 行 
不 会 打印 出 来 。 你 能 发 现 是 哪 一 行 和 为 什么 吗 ? 更 重要 的 是 ， 你 知道 如 何 改正 这 个 错误 吗 ? ) 
; 打印 刘易斯 卡 洛 尔 的 诗 Jabberwocky 的 第 一 节 的 程序 


. Class public jabberwocky 
.Super java/lang/Object 


; 通常 的 样板 
-method public 《init>()VY 
aload_0 


invokespecial java/lang/Object/<init>()Y 
return 
.end method 


-method public static main(Ljava/1iang/String;)Y 
.1imit stack 2 
.1imit locals 2 


; 压 人 要 打印 的 第 一 个 串 / 行 
ldc "Twas briilig, and the S1ithy toves" 
; 调用 在 PrintString 开 始 的 子 例 程 
jsr PrintString ; 这 行 以 后 马上 返回 
， 注意 不 需要 标号 





; 以 类 似 的 方式 继续 
ldc "Did gyre and gimble in the wabe." 
jsr PrintString 





图 4-14 子 例 程 示例 的 完整 程序 (包含 一 个 错误 ) 
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ldc ?AI11 mimsy were the borogroves" 
jsr PrintString 


1dc "And the mome raths outgrabe." 
ysr PrintString 


; 永远 不 要 忘记 引用 诗 的 出 处 
‘ldc "(from Jabberwocky, by Lewis Carrol1)" 


return  ; 退出 方法 ， 因 为 我 们 已 经 打印 了 这 首 诗 


; 假设 这 个 子 例 程 通过 jsr PrintString 调 用 
; 要 打印 的 串 已 经 压 人 到 堆栈 
; 《在 返回 地 址 的 下 面 ) 


PrintString: 
astore_1 ; 将 返回 地 址 存储 到 #1 


; 假设 要 打印 的 串 已 经 在 堆栈 上 

; 你 应 该 已 经 了 解 下 面 三 行 

getstatic java/1ang/System/out Ljava/io/PrintStream; 

swap ， 将 参数 按 正 确 的 顺序 放置 

invokevirtual java/io/PrintStream/printin(Ljava/1ang/String; )V 


ret 1 ; 返回 到 存储 在 #1 中 的 位 置 


.end method 





图 4-14 ( 续 ) 
4.7 例子 : r 的 蒙特 卡 洛 估计 


4.7.1 问题 定义 

现在 每 个 人 都 知道 r 的 值 (3.14159 以 及 更 多 
几 位 )。 数 学 家 是 如 何 计 算出 它 的 值 的 昵 ?在 几 
个 世纪 中 已 经 试验 了 很 多 方法 ， 包 括 一 种 不 是 因 
其 数学 上 的 复杂 性 而 是 因为 其 简单 性 而 闻名 的 。 
我 们 在 这 里 给 出 这 种 方法 的 一 个 变型 ， 该 方法 首 
先 由 George de Buffon 使 用 。 

考虑 〈 随 机 地 和 均匀 地 ) 向 图 4-15 所 显示 的 图 
形 中 掷 飞 镖 。 我 们 假设 飞镖 可 能 击 中 正方 形 区 域内 
的 任何 地 方 。 特 别 是 ， 一 些 飞 镖 会 击 中 圆 内 而 另 一 
些 没 有 击 中 圆 内 。 由 于 正方 形 的 边 长 是 两 个 单位 ， 
故 其 总 面积 是 4。 圆 的 面积 是 ,计算 得 出 面积 为 r。 
这 样 ， 我 们 预计 飞镖 击 中 国内 的 比率 将 会 是 mi4。 图 4.15 可 椒 卡 法 xf 的 图 闪 
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换 名 话说， 如 果 我 们 向 图 中 投 搓 10000 个 飞镖 ， 我 们 预计 会 有 大 约 7854 个 会 击 中 圆 内 部 。 
我 们 其 至 可 将 注意 力 关 注 在 右上 象限 ， 并 得 出 同样 的 结果 。 

这 种 探讨 方法 通常 称 为 蒙特 卡 洛 模 拟 (Monte Carlo simulation) 。 当 你 对 概率 空间 的 精确 
参数 不 确信 有 时， 这 可 成 为 探索 大 概率 空间 的 非常 有 力 的 方法 。 它 也 属于 那 种 计算 机 能 显示 其 
优越 性 的 任务 ， 因 为 简单 的 计算 (飞镖 击 中 哪里 ? 击 中 的 是 圆 内 还 是 圆 外 ) 可 被 重复 成 千 上 
百 万 次 直到 你 得 到 一 个 足够 精确 的 解 。 


4.7.2 设计 

3.4.1 节 讨论 了 随机 数 生成 的 一 点 理论 和 实际 知识 。 在 那 一 节 中 开发 的 代码 可 为 我 们 提供 
随机 的 整数 ， 但 这 里 要 做 一 些 变化 。 主 要 的 变化 是 (在 单位 圆 中 的 ) 每 个 位 置 由 两 个 数 来 定 
义 ， 因 此 就 需要 在 两 个 不 同 的 地 方 调用 生成 器 。 这 就 意味 着 要 使 用 子 例 程 。 

除 此 以 外 ， 该 程序 需要 两 个 计数 器 ， 一 个 用 干 投掷 的 飞镖 数 ， 一 个 用 于 击 中 圆 内 的 飞镖 
数 。 对 于 任意 一 个 飞镖 ， 如 果 其 击 中 的 位 置 是 〈(x*,y)， 则 其 击 中 圆 内 当 且 仅 当 达 + 关 和 19 。 

解决 这 个 问题 的 伪 代 码 大 致 如 图 4-16 所 示 。 问 题 本 身 的 结构 因 涉 及 重复 的 随机 点 生成 以 
及 统计 成 功 和 失败 次 数 ， 所 以 也 表现 出 某 种 循环 的 特质 。 关 系 到 成 功 和 失败 (在 单位 圆 的 内 
部 或 外 部 ) 的 实际 决策 将 用 一 个 ithen 等 价 结构 来 实现 。 总 之 ， 这 个 程序 可 采用 同样 适用 于 其 
他 编程 语言 〈 像 Java 或 Pascal) 的 高 级 结构 来 着 手 设计 。 


total_hits <- 0 
for (total_darts := 1 up to 10000) 
generate (x,y) position for new dart 


if C (x,y) inside circle ) 
total_hits <- total_hits + 1 
endif 
endfor 
final answer is (total_hits / 10000) 
FINAL final answer is (total_hits / 10000) * 4 





图 4-16 用 蒙特 卡 洛 方法 计算 x 的 伪 代 码 


在 这 个 模块 执行 足够 时 间 后 ， 成 功 次 数 与 总 执行 次 数 的 比率 应 该 接近 /4。 

对 于 变量 ， 我 们 将 需要 至 少 两 个 整数 用 作 计 数 器 ， 另 一 个 位 置 用 来 保存 随机 数 种 子 的 当 
前 值 ， 还 有 两 个 位 置 用 来 保存 当前 飞镖 的 〈*, y) 坐标 ， 还 有 第 6 个 变量 用 来 保存 从 随机 数 生 
成 子 例 程 返回 的 位 置 。 必 要 的 控制 结构 已 经 都 在 前 面部 分 讨论 过 了 。 

特别 是 ， 如 果 变 量 # 和 #5 分 别 保存 (作为 浮 点 数 ) 了 x 和 ?坐标 ， 则 只 要 飞镖 在 圆 内 ， 下 
面 的 代码 模块 就 会 递增 在 #1 中 的 计数 器 。 


fload_4 ; 从 #4 装 人 x 坐标 

dup ， 对 其 做 平方 

fmul 
fload_5 ; 从 #5 装 入 y 坐 标 

dup ， 对 其 做 平方 

fmul 

fadd ; 计算 x^2 + y^2 
fconst_1 ， 压 入 1 用 于 比较 
fcmpg ， 做 比较 

ifgt Skip ， 如 果 在 圆 外 ， 则 转 到 Skip 
iinc 工 工 。 ， 递增 在 机 中 的 计数 器 


Skip: ”， 做 需要 的 事情 


日 ”如 果 你 不 确信 这 个 公式 为 什么 可 行 ， 可 以 使 用 距离 公式 。 
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我 们 可 以 修改 3.4.2 节 的 第 一 个 随机 数 生成 器 ， 就 能 相当 容易 地 生成 浮 点 数 ， 见 下 面 的 代 
码 片 断 : 


; 计算 a*oldvalue 

1dc2_w 65537 ; a 是 2^16+1， 存 储 为 长 整数 

iload_3 5 01dvalue 被 存储 为 局 部 变量 #3 

i121 ; 将 o1dvaTue 转 换 成 为 长 整数 

1mu] ; 并 做 乘法 

3 add C 

1dc2_w 5 ; C 是 5， 存 储 为 一 个 长 整数 

ladd ; 并 加 到 a*o1ldvalue 

， 获得 mod m 的 余数 

1dc2_w 4294967291 ， 为 m 装 入 值 

1rem ; 计算 模 

12i ; 转换 回 整 数 

dup ; 复制 , 为 了 存储 

istore_3 ; 为 下 次 存储 新 值 

12f +， 转换 成 浮 点 数 

1dc 4294967291.8 ， 作 为 浮 点 数 装 人 m 

fdiv ; 做 除法 ， 得 到 [0,1) 中 的 数 

; 浮 点 数 留 在 堆栈 顶部 

这 个 片断 又 会 成 为 生成 xf 和 ?坐标 的 子 例 程 的 核心 。 
4.7.3 解答 与 实现 

这 里 给 出 了 完整 的 解答 。 


; 通过 蒙特 卡 洛 模拟 计算 pi 的 程序 


.class public pi 
.super java/lang/0bject 


; 样板 

.method public <init>()V 
aload_0 
invokespecial java/lang/Qbject/<init>OV 
return 

‘end method 


.method public static main([Ljava/lang/String;)V 
.limit stack 4 
limit locals 7 


iconst_0 ; 运 今 投 材 的 飞镖 数 是 0 

istore_1 : 飞镖 数 在 #1 中 

iconst_0 ; 迄今 投 挪 到 内 部 的 飞镖 数 是 0 

istore_2 ， 投手 到 内 部 的 飞镖 数 在 #2 中 

iconst_1 ; 将 随机 数 生 成 器 的 种 子 设 为 1 

istore_3 ; 随机 数 生成 器 种 子 在 #3 中 
Head: 

iload_1 ; 装 入 投掷 飞镖 的 数量 

ldc 10000 ; 与 10000 飞 镖 比较 


if_icmpgt End ; 如 果 多 于 10000， 退 出 循环 
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jsr Random ; 为 x 坐标 获得 随机 浮 点 数 

fstore 4 4 并 存储 到 #4 

jsr Random ; 为 y 坐 标 获得 随机 浮 点 数 

fstore 5 ; 并 存储 到 #5 

fload 4 ; 从 #4 装 和 人 Xx 坐标 

dup ; 求 平方 

fmul 

fload 5 ; 从 辣 装 入 y 举 标 

dup + 求 平方 

fmul 

fadd ; 计算 x^2 + y^2 

fconst_1 1 压 人 1 用 于 比较 

fcmpg ; 做 比较 

ifgt Skip ; 如 果 在 圆 外 ， 则 转 到 Skip 

iinc 2 1 ; 递增 在 #2 中 的 圆 内 飞镖 数 
Skip: 

iinc 1 1 ; 递增 在 所 中 的 投 措 总 飞镖 数 

goto Head ; 并 转 到 循环 的 顶部 
Random: 

astore 6 ; 存储 返回 值 

; 计算 axoldvalue 

ladc2_w 65837  ， a 是 2^16+1， 存 馈 为 长 整数 

iload_3 3 01dvalue 存 储 为 局 部 变量 #3 

i21 ; 将 o1dvalue 转 换 为 长 整数 

lmul ， 并 做 乘 共 

: add C 

ldc2_.w 5 4 为 5， 存 储 为 长 整数 

1add ; 并 加 到 a*oldvalue 


; 并 获得 mod m 的 余数 
ldc2_w 2147483647 ， 为 m 装 入 值 


lrem ; 计算 模 

12i ， 转 换 回 整数 

dup ; 复制 ,为 了 存储 

istore_3 ; 为 下 次 存储 新 值 

i2f ; 转换 成 浮 点 数 

ldc 2147483647 .0 作为 浮 点 数 装 人 m 

fdiv ; 做 除法 ， 得 到 [0,1) 中 的 数 

ret 6 ; 返回 到 存储 于 #6 中 的 调用 环境 
End: 

iload_2 ; 装 和 人 内 部 的 总 飞镖 数 

i2f ; 计算 浮 点 数 比 率 

iload_1 ; 装 人 总 飞镖 数 

i2f ; 计算 浮 点 数 比 率 

fdiv ; 做 除法 ， 计 算 比率 (pi/4) 

ldc 4.0 ; 汪 以 4 

fmul ; 得 到 最 终 的 解 


; 并 打印 
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getstatic java/lang/System/out Ljava/io/PrintStrean; 


swap ; 使 参数 顺序 正确 . 
invokevirtual java/io/PrintStream/print1in(F)V 
return 
.end method 
4.8 ”本章 回顾 


* 当前 正在 执行 的 指令 的 位 置 存储 在 CPU 内 部 的 程序 计数 器 (PC) 中 。 在 正常 情况 下 ， 
每 次 一 条 指令 被 执行 ，PC 就 递增 以 指向 紧 接 着 的 指令 。 

“ 某 些 指令 可 改变 PC 的 内 容 ， 因 而 导致 计算 机 改变 其 执行 路 径 。 这 些 语句 通常 称 为 转移 
语句 或 goto 语 句 。 

“任何 语句 若是 转移 的 目标 则 必须 有 一 个 标号 (label)。 标 号 只 是 一 个 字 ， 通 常 开始 于 一 
个 大 写字 母 ， 标 记 其 在 代码 中 的 位 置 。 

。goto 语 句 执 行 的 是 无 条 件 转 移 。 控 制 直接 转移 到 其 参数 标记 的 点 。 

。 if?? 系 列 的 条 件 转移 将 控制 转移 到 目标 位 置 (也 可 能 不 转移 )。 这 些 指 令 从 堆栈 弹出 一 
个 整数 ， 并 根据 该 整数 的 大 小 和 正 负 来 决定 是 转移 还 是 继续 正常 的 取 指 -执行 周期 。 

"。 ?cmp 系 列 的 语句 用 于 对 非 整 数 类 型 做 比较 。 这 些 指令 从 堆 楼 弹出 两 个 适当 类 型 的 数 ， 
并 根据 第 一 个 参数 是 否 大 于 、 等 于 或 小 于 第 二 个 参数 而 压 人 值 为 1、0 或 -1 的 整数 。 这 
个 整数 接着 就 可 用 于 后 续 的 if?? 指 令 。 

。 if_icmp?? 指 令 将 icmp 语 句 的 功能 与 if?? 条 件 转移 系列 相 结合 成 为 一 条 指令 。 

* 事实 上 ， 像 if/else 语 句 和 while 循 环 这 样 的 高 阶 控制 结构 必须 在 汇编 语言 级 别 用 条 件 和 无 
条 件 转 移 来 实现 。 

。1o0okupswitch 和 tableswitch 语 句 提 供 一 种 执行 多 路 转移 语 名 的 方法 ， 对 于 实现 case 或 
Switch 语句 来 说 ， 这 可 能 比 一 系列 的 ifgelse 语 句 更 高 效 。 

“ 子 例 程 的 工作 原理 是 将 PC 的 当前 值 压 到 堆栈 ， 并 在 子 例 程 结束 时 返回 到 先前 存储 的 位 
置 。 在 jasmin 中 ， 这 分 别 对 应 于 jsr 和 和 ret 指令。 与 多 数 其 他 机 器 不 同 ， 为 安全 原因 ， 
ret 指 令 期 望 在 局 部 变量 中 寻找 返回 地 址 。 因 此 ， 子 例 程 中 的 第 一 个 操作 通常 是 astore 
操作 ， 用 以 将 〈 压 人 的 ) 返回 位 置 从 堆栈 存储 到 局 部 变量 。 


4.9 习题 


1. 为 什么 JVM 不 允许 直接 将 一 个 整数 装 人 到 PC? 

结构 化 编程 的 概念 如 何在 汇编 语言 中 实现 ? 

“如 果 大 于 0 或 小 于 0 则 转移 ”指令 在 JVM 指 令 集 可 得 到 吗 ? 如果 没 有 ， 你 如 何 实现 它 ? 
.NaN (不 是 一 个 数 ) 大 于 或 小 于 0 吗 ? 

尔 如 何在 jasmin 中 建立 一 个 if/else-if/else-if/else 控 制 结 构 ? 

goto 和 goto_w 之 间 有 什么 差别 ? 有 相应 的 ifne_w 指 令 吗 ? 

在 图 4-8 中 的 代码 使 用 irem 来 确定 一 个 数 的 奇偶 性 。Juola 的 “multiple cat skinning” 定 律 指 
出 做 任何 事情 总 有 更 多 的 方法 。 你 能 找 出 一 种 方法 ， 用 iand 来 确定 一 个 数 的 奇偶 性 吗 ? 用 
ior 怎 么 做 ? 

. 用 移 位 操作 怎么 做 昵 ? 

9. 图 4-14 中 的 错误 是 什么 ? 解决 方案 是 什么 ? 

10， (本 题 针 对 高 级 程序 员 ) 本 章 中 提出 的 jsr 和 ret 的 语义 支持 递归 吗 ? 并 给 予 解释 。 


Oo 
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4.10 编程 习题 


. 写 一 个 程序 ， 确 定 小 于 或 等 于 N 的 2 的 最 大 寡 。 

.至 少 有 两 个 不 同 的 方法 能 针对 前 面 的 问题 编写 程序 ， 一 个 使 用 移 位 指令 ， 一 个 使 用 乘法 / 除 
法 指令 。 在 你 的 机 器 上 哪个 运行 得 更 快 ? 

. 写 一 个 程序 ， 确 定 能 装 入 一 个 整数 变量 的 N 的 最 大 寡 。 再 确定 能 装 入 一 个 长 整数 局 部 变量 的 
AN 的 最 大 客 。 你 如 何 判定 什么 时 候 发 生 溢出 ? 

. 写 一 个 程序 ， 使 用 密 钥 N= 13*17 和 e= 11 实 现 RSA 加 密 和 解密 (你 可 能 要 在 Web 上 查找 这 个 
算法 ) 。 

5.a. 写 一 个 程序 ， 测 试 随机 数 生成 器 的 优 劣 。 特 别 地 ， 访 程序 应 该 以 大 致 相同 的 频率 产生 所 有 
输出 。 随 机 生成 从 1 到 10 的 100 000 个 数 。 最 小 频率 的 数 应 该 至 少 在 最 高 频率 的 数 的 90% 频 
率 内 。 你 的 生成 器 优 劣 如 何 ? 

b. 寻找 产生 一 个 好 的 生成 器 的 a、c、m 的 值 。 

c. 寻找 产生 一 个 坏 的 生成 器 的 4、c、m 的 值 。 

d. (本 题 针对 高 级 程序 员 ) 对 生成 器 的 输出 运行 chi- 平 方 测试 以 确定 其 优 劣 程度 。 
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第 5 章 通用 体系 结构 问题 : 实际 计算 机 


5.1 虚拟 机 的 限制 


JVM 作 为 虚拟 机 已 经 在 大 多 数 真实 计算 机 上 得 以 实现 。 在 某 种 意义 上 ，JVM 设 计 者 已 经 
取得 了 很 大 的 成 功 一 一 因为 IVM 是 非常 简单 并 且 易 于 理解 的 体系 结构 ， 也 是 计算 机 组 织 与 体 
系 结构 教学 的 最 佳 用 机 之 一 。 然 而 ， 这 种 简明 在 某 种 程度 上 忽略 了 实际 计算 机 器 件 的 某 些 限 
制 。 例 如 ，JVM 中 的 每 个 方法 (method) 假定 运行 在 其 自 包 含 的 环境 中 ， 改变 一 个 方法 中 的 
局 部 变量 不 会 影响 其 他 的 方法 。 相 比 之 下 ， 只 有 一 个 CPU 和 一 个 主 存储 器 的 实际 计算 机 意味 
着 同时 运行 两 个 功能 会 引起 对 寄存 器 、 存 储 器 等 的 争 用 。 你 可 以 想象 ， 如 果 一 个 支票 填写 程 
序 开 始 接收 数据 (比如 从 一 个 游戏 )， 同 时 开始 打印 支付 星云 学 会 剩余 光子 鱼雷 的 支票 将 会 导 
致 的 混乱 。 

类 似 地 ， 机 器 容量 问题 对 于 JVM 或 者 类 似 的 虚拟 机 来 说 却 不 是 问题 ， 对 于 所 有 实际 用 途 ， 
JVM 虚 拟 机 的 栈 具 有 无 限 的 深度 ， 能 够 容纳 无 限量 的 局 部 变量 。 对 比 之 下 ，PowerPC (用 于 
游戏 机 的 芯片 ， 近 来 也 用 于 Macintosh) 只 有 32 个 寄存 器 用 于 计算 ， 而 基于 Pentium 的 Windows 
PC 用 于 计算 的 寄存 器 就 更 少 了 。 

JVM 能 够 忽略 的 另外 一 个 主要 问题 便 是 速度 。 要 快速 地 执行 一 个 JVM 程 序 ， 你 仅 需要 在 
一 个 快速 的 物理 处 理 器 上 运行 一 个 JVM 的 拷贝 。 相 比 来 说 ， 要 建造 一 个 快速 的 物理 处 理 器 ， 
就 需要 解决 具有 难度 和 竞争 性 的 工程 问题 。Intel 和 AMD 的 工程 师 一 直 在 进行 前 沿 探索 ， 以 便 
制造 更 快速 的 处 理 器 。 当 然 ， 世 界 上 那些 训练 有 素 的 工程 师 们 正在 逐步 解决 这 一 难题 ， 虽 然 
如 何 解决 这 些 问题 的 细节 已 经 超出 了 本 书 的 范围 ， 但 是 接 下 来 的 各 节 将 会 探讨 一 些 提高 性 能 
的 部 件 优 化 方法 。 


5.2 CPU 优化 


5.2.1 ”建造 一 个 更 好 的 捕 鼠 夹 

改善 计算 机 性 能 的 最 明显 方式 就 是 提高 整体 性 能 参数 一 一 例如 ， 将 计算 机 的 字 长 从 16 位 
增加 到 32 位 。 两 个 32 位 数 的 加 法 在 一 个 32 位 的 计算 机 上 只 需要 一 个 加 操作 就 可 以 完成 ， 但 是 
在 一 个 16 位 的 计算 机 上 却 要 通过 至 少 两 次 相 加 才能 完成 。 类 似 地 ， 将 时 钟 速度 从 500MHz 增 加 
到 1GHz 能 将 每 个 操作 减少 到 原来 的 一 半 时 间 ， 相 当 于 机 器 的 性 能 增加 了 一 倍 。 

实际 上 ， 很 少 能 像 人 们 认为 的 那样 有 效 。 目 前 几乎 所 有 的 机 器 都 是 32 位 ，32 位 寄存 器 对 
于 大 部 分 应 用 已 经 足够 精确 了 。 采 用 64 位 的 寄存 器 能 使 程序 员 设计 支持 102 数 量 级 的 快速 数据 
操作 ， 但 是 多 久 你 需要 用 到 一 次 这 种 数量 级 的 操作 呢 ? 除 此 之 外 ， 如 果 存 储 器 和 总 线 的 速度 
都 没有 CPU 的 速度 快 ， 即 使 CPU 很 快 也 不 一 定 能 带 来 多 大 的 益处 。 
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更 为 严峻 的 是 ， 以 这 种 提高 速度 的 方式 提高 性 能 是 昂贵 的 、 困 难 的 。 例 如 ， 处 理 器 算术 
运算 器 件 的 速度 受 限于 晶体 管 的 物理 和 电气 响应 特征 ， 运 行 太 快 容易 使 其 毁坏 。 即 使 能 够 制 
造 速度 很 快 的 晶体 管 ， 成 本 恐怕 也 是 超级 高 。 建 造 64 位 计算 机 就 属于 这 种 情形 ， 不 但 需要 昂 
贵 的 晶体 管 ， 还 同时 需要 两 倍数 量 的 晶体 管 。 因 此 ， 工 程 师 们 一 直 探索 在 一 般 的 技术 架构 下 
改善 计算 机 的 性 能 。 


5.2.2 ”多 处 理 

让 计算 机 更 加 有 效 的 一 种 方式 是 在 同一 时 间 执 行 多 个 程序 。 你 可 能 正在 写作 业 ， 然 后 停 
下 来 去 加 载 一 个 网 页 ， 并 且 同 时 查看 计算 机 正在 自动 接收 的 你 室友 发 来 的 邮件 ， 与 此 同时 还 
有 人 正在 下 载 你 的 个 人 主页 看 你 近来 的 照片 。 只 有 一 个 CPU (因此 只 有 一 个 指令 寄存 器 ) ， 计 
算 机 如 何 应 付 这 些 工作 ? 

除了 再 买 一 个 电脑 一 一 这 是 可 行 的 ， 但 是 这 样 很 昂贵 并 且 对 技术 要 求 很 高 一 一 一 种 通常 
的 选择 是 分 时 (time-sharing)。 如 同 分 时 使 用 假日 公寓 一 样 ， 将 时 间 分 为 时 间 片 (假日 公寓 以 
星期 为 时 间 片 ，CPU 以 毫秒 或 微 秒 为 时 间 片 )， 人 允许 使 用 设备 的 某 个 时 间 片 。 当 这 个 时 间 片 用 
完 时 ， 其 他 人 轮换 进来 度假 一 周 或 使 用 CPU。 为 了 以 这 种 分 时 方式 工作 ， 计 算 机 必须 能 将 程 
序 停止 在 任意 处 ， 将 与 程序 有 关 的 信息 〈 栈 的 状态 ， 局 部 变量 ， 当 前 PC 等 ) 拷贝 到 主 存 中 ， 
并 且 从 不 同 的 存储 区 域 加 载 其 他 程序 的 有 关 信 息 。 只 要 时 间 片 和 存储 区 域 是 各 自 独立 的 (我 
们 稍 候 将 会 看 到 如 何 实现 这 两 点 ) ， 计 算 机 就 好 像 在 同时 运行 若干 不 同 的 程序 。 

出 于 安全 的 考虑 ， 每 个 程序 必须 能 够 独立 地 运行 ， 每 个 程序 都 应 防止 影响 其 他 的 程序 。 
另 一 方面 ， 计 算 机 需要 有 一 种 系统 化 的 方式 能 够 适时 地 将 用 户 程序 换 入 换 出 CPU。 这 不 是 靠 
每 个 用 户 程序 的 良好 表现 ， 而 是 要 借助 操作 系统 进行 管理 。 操 作 系 统 本 身 也 是 一 个 程序 ， 但 
是 操作 系统 的 主要 工作 是 控制 其 他 的 程序 ， 并 且 实 施 安全 规则 。 操 作 系 统 (简称 OS， 如 
MacOS、OS 和 X， 帮 至 MS-DOS) 被 授予 普通 用 户 级 程序 所 没有 的 特权 ， 包 括 中 断 现 行程 序 的 
能 力 、 向 与 程序 使 用 无 关 的 存储 区 域 写 入 数据 的 能 力 等 一 一 这 些 权 力 常 被 形式 化 为 编程 模型 ， 
并 且 定 义 了 超级 用 户 与 普通 用 户 权限 的 差别 。 


5.2.3 ”指令 集 优化 . 

加 速 计算 机 的 一 种 方法 就 是 使 每 条 指令 执行 得 更 快 些 。 例 如 ， 经 常 出 现 的 指令 应 该 在 硬 
件 上 做 些 调整 ， 使 其 比 其 他 的 指令 执行 得 更 快 些 。 这 种 优化 技术 已 经 用 在 了 JVM 上 ， 例 如 
i10ad-_0 指 令 。i1oad_0 指 令 比 与 其 等 价 的 i1oad 0 指令 长 度 短 〈1 个 字 节 ) 并 且 速 度 快 。( 当 
然 ， 几 乎 每 个 方法 都 会 使 用 局 部 变量 #0， 但 是 很 少 会 用 到 比如 说 局 部 变量 #245。) 取决 于 要 运 
行 的 程序 ， 有 些 指 令 经 常 使 用 ， 设 计 者 应 该 对 其 进行 优化 。 

例如 ， 在 上 面 描述 的 多 道 程序 系统 中 ,“ 将 所 有 的 局 部 变量 保存 到 主 存 ”应 该 是 一 个 常见 
的 行为 。 一 个 更 易 理 解 的 常见 并 且 高 需求 应 用 的 例子 就 是 图 形 比 重 高 的 电脑 游戏 。 良 好 的 图 
形 性 能 反 过 来 需要 快速 将 数据 〈 位 图 ) 从 主 存 移 到 图 形 显示 设备 。 每 次 向 CPU 装 载 一 个 字 的 
数据 然后 再 将 其 存 人 显卡 ， 不 如 用 伪 指 令 将 一 大 块 数据 直接 从 存储 器 移 至 显卡 。 这 种 存储 器 
直接 访问 (DMA) 是 很 多 现代 计算 机 都 支持 的 基本 指令 类 型 。 类 似 地 ， 对 整个 存储 块 执行 算 
术 操 作 〈 例 如 ， 用 一 个 操作 将 全 屏 变 为 橙色 ) 是 Intel 后 期 部 分 芯片 基本 指令 集 具 备 的 能 力 。 
“对 不 同 的 数据 独立 执行 同 种 操作 ”是 对 处 理 能 力 的 根本 性 增强 。 借 助 于 并 行 操作 (这 种 并 行 
操作 称 为 SIMD 并 行 ， 即 单 指令 多 数据 ) 可 以 极 大 地 提高 程序 的 有 效 速度 。 


5.2.4 ”流水 化 
使 CPU 工作 得 更 快 的 另外 一 种 方式 是 在 给 定 的 微 秒 时 间 内 打包 处 理 多 条 指令 。 正 如 字面 
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表述 的 意义 ， 一 种 可 能 就 是 在 一 个 时 间 内 处 理 多 条 指令 。 为 了 实现 这 一 点 ，CPU 需 要 有 一 个 
复杂 、 流 水 化 的 取 指 一 执行 周期 允许 其 同时 处 理 多 条 不 同 的 指令 。 

等 一 下 ! 这 怎么 可 能 ? 穷 门 在 于 多 个 操作 依次 进行 ， 但 是 每 个 操作 分 为 多 个 阶段 ， 而 且 
各 个 阶段 以 流水 化 的 方式 处 理 。 举 一 个 实例 ， 一 排 人 站 成 一 个 传 水 的 队列 ， 我 不 是 将 水 从 并 
口 擒 到 40 英 尺 远 的 炉灶 旁 ( 可 能 需要 1 分 钟 )， 而 是 将 水 桶 从 与 我 邻近 的 人 手中 接 过 来 ， 然 后 
传 给 离 我 4 英尺 远 的 下 一 个 人 。 尽 管 水 桶 离 炉灶 还 有 36 英 尺 远 ， 但 是 我 的 手 已 经 空闲 下 来 了 ， 
可 以 接送 下 一 桶 水 了 。 每 桶 水 从 并口 传 到 炉灶 仍 需 要 1 分 钟 的 时 间 ， 但 是 可 以 有 10 桶 水 在 被 同 
时 传递 ， 因 此 单位 时 间 里 就 有 10 倍 数量 的 水 被 送 到 炉灶 旁 。 另 外 一 个 好 案例 就 是 汽车 生产 线 ， 
每 个 工人 不 是 一 次 组 装 全 车 ,而 是 只 负责 单一 的 任务 环节 ， 汽 车 的 组 装 由 多 个 小 环节 构成 。 
更 普通 的 一 个 例子 ， 如 果 我 有 很 多 的 衣服 要 洗 ， 我 将 一 部 分 衣服 放 入 洗衣 机 ， 当 这 些 衣物 洗 
完 时 ， 我 又 将 其 放 入 了 干燥 机 ， 然 后 我 又 将 另外 一 部 分 衣服 放 入 洗衣 机 ， 这 时 两 个 机 器 会 同 
时 运行 。 

现代 高 端 CPU 都 进行 这 种 任务 分 解 。 例 如 ， 当 CPU 的 一 部 分 正在 执行 一 条 指令 时 ，CPU 
的 另外 部 分 已 经 正在 取 其 他 的 指令 了 。 当 这 条 指令 执行 完成 时 ， 下 一 条 指令 已 准备 就 绪 等 待 
执行 。 这 种 流程 也 称 为 指令 预 取 (instruction prefetch) ， 在 CPU 真正 需要 这 条 指令 之 前 ， 它 
就 被 取出 了 ， 因 此 这 条 指令 立即 可 用 。 本 质 上 ，CPU 同 时 服务 于 两 条 指令 ， 因 此 可 以 在 给 定 
的 时 间 内 处 理 两 倍 的 指令 ， 如 图 5-1 和 图 5-2 所 示 。 这 并 不 能 改善 延迟 (latency) 一 一 每 个 操作 





从 开始 到 结束 仍然 需要 同样 的 时 间 一 一 但 是 可 以 显著 地 提高 吞吐 率 〈throughput) ， 即 CPU 每 
秒 能 够 处 理 的 指令 总 数 。 
2p.m. 3p.m. 4p.m. $p.m. 6p.m. 7p.m. 
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图 5-1 非 流水 化 洗衣 : 6 个 小 时 内 洗 两 次 
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图 5-2 流水 化 洗衣 : 6 个 小 时 内 洗 四 次 


流水 线 的 阶段 数 通常 是 不 相同 的 ， 取 决 于 具体 的 计算 机 ， 通 常 新 的 、 速 度 快 的 计算 机 流 
水 线 的 段 数 要 多 一 些 。 例 如 ， 典 型 的 中 等 级 别 的 PowerPC (如 603e 型 ) 采用 一 个 4 段 流水 线 ， 
可 以 同时 处 理 最 多 4 条 指令 。 第 一 个 阶段 是 取 指 阶段 ， 将 指令 从 主 存 载 人 CPU ， 作 为 下 一 条 要 
被 处 理 的 指令 。 一 条 指令 一 旦 被 取出 ， 分 派 阶段 就 对 其 进行 分 析 确定 该 指令 的 种 类 ， 并 且 从 
相应 的 位 置 获 取 源 操作 数 ， 然 后 准备 由 流水 线 的 第 三 个 阶段 (执行 阶段 ) 执行 。 最 后 完成 / 写 
回 阶段 将 计算 结果 送 到 相应 的 寄存 器 ， 并 且 根 据 需 要 更 新 整个 机 器 的 状态 (图 5-3)。 

为 了 使 流水 化 的 过 程 尽 可 能 有 效 ， 流 水 线 应 该 一 直 都 充满 指令 ， 并 且 数 据 一 定 要 平稳 地 
流动 。 首 先 ， 流 水 线 只 能 以 其 最 慢 流水 段 的 速度 运行 。 简 单 的 事情 ， 如 取 某 一 条 指令 ， 能 够 
和 机 器 访 存 一样 快 地 完成 ， 但 是 指令 的 执行 ， 特 别 是 复杂 的 指令 ， 就 需要 更 多 的 时 间 。 当 其 
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中 某 条 指令 执行 时 ， 可 能 会 在 流水 线 中 导致 障碍 (有 了 时 称 为 “气泡 ”)， 致 使 其 他 的 指令 堆积 
在 其 后 ， 如 同 很 多 小 轿车 跟 在 一 个 慢 吞 吞 的 公交 车 后 。 理 想 的 情况 是 每 个 流水 段 应 该 占用 同 
样 的 时 间 ， 流 水 线 的 设计 者 应 该 确保 做 到 这 一 点 。 





图 5-3 类 PowerPC 的 流水 线 


其 他 中 断 流水 的 方式 就 是 从 错误 的 存储 器 位 置 加 载 了 错误 的 数据 。 这 一 考虑 的 最 坏 违反 
情况 就 是 条 件 转移 ， 例 如 “jump if less than”( 如 果 小 于 就 跳 转 )。 一 旦 遇 到 了 这 条 指令 ， 下 
一 条 指令 要 么 来 自 于 指令 序列 的 顺序 下 一 条 ， 要 么 来 自 于 转移 目标 处 的 指令 一 一 我 们 可 能 不 
知道 是 哪 一 条 。 事 实 上 ， 我 们 没有 办 法 知道 是 哪 一 条 ， 因 为 条 件 依赖 于 流水 线 的 计算 结果 ， 
当前 尚 无 法 得 到 该 结果 。 无 条 件 转移 的 情况 还 不 太 坏 ， 只 要 计算 机 有 办 法 足够 快 地 辨识 它 
(通常 在 流水 线 的 第 一 阶段 进行 ) 就 行 。 子 程序 返回 也 带 来 其 特有 的 问题 ， 因 为 返回 目标 保存 
在 寄存 器 中 ， 可 能 已 经 不 可 用 了 。 最 坏 的 情况 是 ， 计 算 机 别 无 选择 ， 只 能 停 下 来 等 待 流水 线 
排 空 (这 会 严重 影响 性 能 ， 因 为 转移 指令 很 常见 ) 。 考 虑 到 这 一 缘由 ， 很 多 研究 开始 关注 预测 
转移 目标 的 能 力 ， 以 便 继续 保持 流水 线 的 填充 。 转 移 预 测 (branch prediction) 是 计算 机 猜测 
是 否 执行 给 定 分 支 〈 以 及 转移 目标 ) 的 艺术 。 基 于 这 一 猜测 ,计算 机 将 继续 执行 指令 ， 产 生 
的 结果 也 可 能 是 无 效 的 。 这 些 结果 通常 保存 在 流水 线 的 特殊 位 置 ， 如 果 猜 测 被 确认 是 正确 的 
才 将 其 撕 贝 到 相应 的 寄存 器 中 。 如 果 猜 测 是 错误 的 ， 这 些 位 置 将 被 清空 ， 计 算 机 在 一 个 空 的 
流水 线 上 重新 开始 。 可 以 想象 ， 最 坏 的 情况 就 是 流水 停顿 ， 如 果 计 算 机 猜测 正确 ， 还 可 以 节 
省 一 些 时 间 。 

即使 较 差 的 算法 也 应 该 有 50% 的 猜测 是 正确 的 ， 因 为 转移 要 么 成 功 要 么 不 成 功 。 检 查 整 
个 程序 作出 更 准确 的 猜测 通常 是 可 能 的 。 例 如 ， 对 应 for 循 环 的 机 器 代码 通常 包括 一 个 代码 块 
和 一 个 位 于 循环 结尾 处 的 (向 后 ) 转移 。 既 然 大 多 数 此 类 循环 都 执行 不 止 一 次 (通常 成 百 上 
千 次 )， 就 要 有 很 多 次 转移 成 功 和 一 次 转移 不 成 功 。 这 种 情况 下 猜测 转移 成 功 可 以 达到 99.9% 
的 准确 率 。 更 加 精确 的 分 析 是 否 看 每 个 转移 指令 的 历史 。 如 果 一 个 转移 指令 已 经 执行 了 两 次 ， 
而 且 两 次 都 没有 转移 成 功 ， 那 就 可 以 推测 它 这 一 次 也 不 会 转移 成 功 。 借 助 大 量 的 多 种 可 用 信 
息 ， 工 程 师 们 已 经 可 以 让 现代 处 理 器 的 流水 化 设计 非常 准确 地 (90% 以 上 ) 猜测 转移 了 。 


5.2.5 ”超标 量 体 系 结构 

涉及 多 条 不 同 指令 的 其 他 技术 还 有 重复 设置 流水 阶段 甚至 是 整 条 流水 线 。 流 水 化 的 难点 
之 一 是 保持 各 个 流水 阶段 的 均衡 ， 如 果 某 条 指令 的 执行 比 其 取 指 时 间 要 长 得 多 ， 那 么 就 应 该 
对 流水 阶段 进行 备份 。 超 标量 处 理 的 思想 就 是 在 同一 个 周期 立即 执行 多 条 不 同 的 指令 。 为 了 
充分 理解 这 一 点 ， 需 要 将 取 指 -执行 周期 一 体 化 ， 并 且 假 设 并 非 每 次 只 取 一 条 指令 ， 而 是 我 们 
有 一 个 等 待 处 理 的 指令 长 队 。( 显 然 ， 这 就 是 经 常 所 说 的 指令 队列 一 一 并 没有 假想 的 成 份 。) 
典型 的 CPU 会 采取 模块 复制 来 解决 耗 时 的 操作 。 一 个 类 似 的 例子 是 给 一 个 繁忙 的 高 速 公路 增 
加 一 个 车 道 ， 以 便 缓解 增加 的 交通 流量 。 类 似 地 ， 想 一 下 一 般 银 行 的 处 理 方式 ， 每 个 出 纳 员 
都 可 以 为 下 一 个 客户 服务 。 如 果 一 个 客户 的 问题 比较 复杂 ， 需 要 花 很 多 时 间 处 理 ， 其 他 出 纳 
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员 就 可 以 缓解 这 种 停滞 。 与 先前 描述 的 SIMD 并 行 不 同 ， 这 是 一 种 MIMD (多 指令 ， 多 数据 ) 
并 行 。 当 一 条 流水 线 正在 处 理 某 条 指令 (可 能 是 浮 点 乘法 ) 时 ， 另 外 一 条 流水 线 可 能 正在 进 
行 另 一 个 完全 不 同 的 操作 (可 能 是 加 载 一 个 寄存 器 )。 


补充 资料 
Connection Machine 

如 果 你 想 了 解 一 个 真正 的 并 行 操作 ， 看 一 下 Thinking Machines 公司 在 20 世 纪 80 年 代 
末期 制造 的 Connection Machine 体 系 结构 。CM-1 (不 久 又 有 了 更 快 的 版 本 CM-2) 型 机 包 
食 了 多 达 65536 个 不 同 的 单元 ， 每 个 都 是 一 个 独立 的 1bit 处 理 器 。 所 有 的 单元 都 与 被 称 为 
“ 微 控 制 器 ”的 中 央 部 件 连接 ， 这 个 微 控 制 器 向 每 个 处 理 器 发 出 相同 的 “ 纳 指 令 " 
(nanoinstruction)。CM-5 型 机 只 能 控制 16384 个 不 同 的 处 理 器 ， 但 是 每 个 处 理 颖 都 是 一 个 
功能 强大 的 Sun 工 作 站 。 这 些 处 理 器 独立 运行 ， 但 是 也 可 以 快速 、 灵 活 地 将 其 互联 ， 用 来 
完成 高 速 的 并 行 计算 。 

最 初 的 CM-1 采 用 一 种 定制 单元 体系 结构 ， 每 个 芯片 上 有 16 个 单元 。 这 些 芯片 又 被 连 
接 在 一 起 形成 一 个 12 路 的 超 立 方 体 (12-way hypercube) 用 来 构建 一 个 非常 密集 的 网 络 ， 
并 且 所 有 的 单元 彼此 可 以 快速 地 通信 。 理 念 上 ，Connecion Machines 要 尝试 挖 据 大 规模 并 
行 的 可 能 性 ， 如 人 脑 一 样 ， 并 且 超 越 传 统 冯 ' 诺 依 曼 体 系 结构 的 某 些 限制 。 一 个 神经 元 不 
具备 强大 的 计算 能 力 ， 但 是 正常 人 脑 中 102 个 神经 元 可 以 完成 惊人 的 工作 。 以 实用 的 术语 
描述 ，CM-1 可 以 被 看 成 是 64K 路 SIMD 并 行 。 遗 憾 的 是 ， 专 用 芯片 的 成 本 太 高 ， 因 此 CM- 
5 转向 较 少 数量 的 商用 SPARC 芯 片 ， 并 由 此 放弃 了 SIMD 处 理 ( 像 人 脑 一 样 ) 而 青睐 于 
MIMD。 目 前 CM-5 的 后 继 机 型 在 例如 Beowulf 机 群 并 行 处 理 中 非常 活跃 。 





5.3 ”存储 器 优化 


为 了 使 计算 机 尽 可 能 快速 、 平 稳 地 运行 需要 确保 两 件 事情 。 首 先 ， 计 算 机 所 需 的 数据 要 
尽快 地 可 用 ， 以 使 计算 机 不 必 耗 时 去 等 待 。 另 外 ， 存 储 器 应 该 防止 被 意外 地 重 写 ， 比 如 用 户 
邮件 代理 不 能 从 Web 浏 览 器 上 误 读数 据 并 将 你 所 看 到 的 该 页 内 容 发 给 其 他 的 人 。 


5.3.1 cache 存储 器 

对 于 32 位 字 长 的 计算 机 ， 每 个 寄存 器 都 能 表示 2 ( 约 40 亿 ) 个 模式 。 理 论 上 ， 这 允许 处 
理 器 使 用 4GB 的 存储 器 。 而 实际 上 ， 计 算 机 所 安装 的 存储 器 容量 通常 要 小 得 多 ， 对 于 某 个 程 
序 来 说 实际 使 用 的 存储 器 容量 就 更 小 了 。 最 重要 的 是 ,程序 通 常 在 某 个 时 刻 只 使 用 整个 程序 
中 的 很 小 一 部 分 (比如 ，Web 浏 览 器 中 下 载 网 页 的 代码 只 有 在 你 真正 点 击 按钮 时 才 会 使 用 )。 

存储 器 有 多 种 不 同 的 访问 速度 ， 也 就 是 说 ， 不 同 的 存储 芯片 检索 1 比特 信息 所 需要 的 时 间 
是 不 同 的 。 由 于 速度 的 关系 ， 最 快 的 存储 器 芯片 的 成 本 也 最 高 。 大 部 分 程序 在 某 一 时 刻 只 需 
要 较 小 的 存储 容量 ， 因 此 大 多 数 实际 的 计算 机 采用 多 级 存储 结构 。 尽 管 CPU 蕊 片 本 身 可 以 达 
到 2 或 3GHz 的 运行 速度 ( 即 0.3~0.5ns 内 执行 一 条 指令 )， 但 是 大 部 分 存储 器 芯片 都 非常 的 慢 ， 
有 时 存储 器 的 响应 时 间 是 50~100ns。 这 看 起 来 也 许 已 经 很 快 了 ， 但 是 比 起 CPU 芯片 慢 了 将 近 
400 倍 。 为 了 减少 存储 器 访问 瓶颈 ， 计 算 机 也 采用 少量 非常 高 速 的 存储 器 ， 但 是 容量 要 小 得 多 
(通常 最 多 几 兆 字 节 ) ， 称 为 cache 存 储 器 。( 读 作 “CASH” 存 储 器 ， 源 自 法 语 动词 cacher， 音 
思 是 “隐藏 。) 它 的 基本 思想 是 近期 经 常 使 用 的 存储 区 域 被 复制 到 cache 存 储 器 中 以 便 CPU 需 
要 其 中 的 数据 时 能 够 尽快 地 得 到 。cache 存 储 器 的 设计 和 使 用 是 一 个 艰巨 的 任务 ，CPU 自 身 处 
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理 这 其 中 的 细节 ， 程 序 员 不 必 为 此 担心 。 大 多 数 计算 机 支持 两 级 cache: 一 级 (L1) cache 位 
于 CPU 片 内 并 且 以 CPU 的 速度 运行 ， 而 二 级 (L2) cache 是 一 组 特殊 的 高 速 存储 芯片 ， 靠 近 
CPU 位 于 主板 上 。 正 如 你 所 期 望 的 ，L1 cache 速 度 较 快 并 且 昂 贵 ， 这 意味 着 LI1 cache 容 量 最 小 ， 
但 是 能 够 带 来 最 大 的 性 能 提升 。 


5.3.2 ”存储 管理 

拥有 32 位 字 长 的 计算 机 能 够 向 22 个 不 同 的 存储 单元 写 人 。!( 当 然 ，64 位 的 计算 机 有 2%4 个 不 
同 的 地 址 。) 这 些 地 址 定义 了 程序 可 用 的 逻辑 存储 空间 。 当 然 ， 任 何 计算 机 可 用 的 物理 空间 取 
决 于 所 安装 的 芯片 存储 容量 ， 也 部 分 地 取决 于 计算 机 的 拥有 者 能 够 或 愿意 花 多 少 钱 购置 存储 
容量 。 程 序 不 指向 某 一 物理 存储 位 置 ， 而 是 指向 某 一 逻辑 地 址 ， 然 后 由 存储 管理 将 其 转换 为 
某 一 物理 存储 器 位 置 ， 甚 至 可 能 是 硬盘 的 某 一 位 置 。 

存储 管理 通常 被 认为 是 操作 系统 的 功能 ， 但 是 考虑 到 速度 、 便 捷 以 及 安全 的 因素 ， 很 多 
计算 机 对 此 提供 了 硬件 上 的 支持 。 尽 管 考 虑 到 安全 问题 使 得 用 户 级 程序 不 能 访问 这 部 分 硬件 。 
这 就 意味 着 存储 系统 的 大 多 数 有 趣 的 部 分 对 于 用 户 来 说 是 看 不 到 的 ， 而 只 有 管理 模式 下 执行 
的 程序 才能 感受 到 。 用 户 所 关心 的 存储 器 只 是 一 个 逻辑 存储 空间 的 一 维 数组 ， 其 中 的 每 个 元 
素 都 可 以 独立 访问 。 因 为 这 很 重要 ， 所 以 有 必要 再 次 强调 : 即使 真实 的 物理 存储 器 比 逻 辑 地 
址 空间 相当 大 或 者 相当 小 ， 用 户 级 程序 都 能 够 视 逻 辑 地 址 如 同 物理 地 址 ， 并 且 用 适当 长 度 的 
位 模式 表示 物理 存储 器 的 某 个 存储 位 置 。 

在 存储 管理 之 下 ， 需 要 进行 逻辑 存储 地 址 到 物理 地 址 的 转换 。 地 址 转换 使 得 计算 机 能 够 
访问 直接 与 物理 存储 器 对 应 的 存储 位 置 。 这 个 过 程 利用 了 地 址 替代 将 一 个 地 址 空间 (逻辑 存 
储 器 ) 转换 为 另 一 个 地 址 空间 (物理 存储 器 ) 。 这 种 存储 过 程 以 及 存储 地 址 空间 通常 被 称 为 虚 
拟 存 储 。 为 了 简明 地 解释 这 个 问题 ， 我 们 将 以 32 位 的 PowerPC 为 例 对 有 些 抽象 的 存储 管理 加 
以 介绍 。 有 多 种 不 同 的 方法 完成 这 一 转换 ， 下 面 详细 说 明 。 


5.3.3 ”直接 地 址 转换 

最 简单 的 确定 物理 地 址 的 方法 就 是 直接 地 址 转换 ， 当 硬件 地 址 转换 已 经 被 关闭 时 采用 此 
方法 (显然 ， 只 有 管理 程序 能 够 将 硬件 地 址 转换 关闭 ) 。 在 这 种 情况 下 ， 物 理 地址 的 每 一 位 都 
与 逻辑 地 址 相同 ， 并 且 只 能 访问 到 4GB 的 存储 空间 。 如 果 两 个 进程 试图 访问 同一 个 逻辑 地 址 ， 
没有 简易 的 方法 来 阻止 。 直 接地 址 转换 通常 用 于 关心 速度 的 专用 计算 机 ， 每 次 只 运行 一 个 程 
序 ， 除 此 之 外 ， 大 多 数 操作 系统 实施 了 另外 某 种 地 址 转换 。 


5.3.4 ”页 式 地 址 转换 

为 了 防止 两 个 进程 访问 同一 个 物理 地 址 (如 果 人 允许 地 址 转换 时 )，CPU 的 存储 管理 系统 实 
际 上 将 逻辑 地 址 空间 扩展 到 第 三 个 空间 ， 称 为 虚拟 地 址 空间 。 例 如 ， 我 们 可 以 定义 一 组 24 位 
的 段 寄存 器 来 扩大 地 址 值 。 在 这 种 情况 下 ,逻辑 地 址 的 高 4 位 定义 并 选择 一 个 具体 的 段 寄存 器 。 
这 个 段 寄 存 器 里 保存 的 数值 定义 了 一 个 具体 的 24 位 虚拟 段 标识 符 VSID (Virtual Segment 
IDentifier) 。 这 个 虚拟 地 址 由 24 位 的 VSID 和 逻辑 地 址 的 低 28 位 并 接 而 成 ， 如 图 5-4 所 示 。 这 就 
创建 了 一 个 新 的 52 位 地 址 ， 因 此 能 够 处 理 更 多 的 存储 进而 防止 冲突 。 

例如 ， 计 算 机 要 访问 存储 位 置 0x13572468 (一 个 32 位 地 址 )。 高 4 位 0x1) 指示 计算 机 应 
该 查看 段 寄 存 器 #1 。 进 一 步 假设 这 个 段 寄 存 器 包含 数值 0xAAAAAA (24 位 ) 。 将 该 值 与 最 初 
存储 器 地 址 并 接 为 一 个 52 位 的 地 址 0xAAAAAA3572468。 另 一 方面 ， 如 果 另 外 一 个 程序 要 访 
问 同一 个 逻辑 地 址 ， 但 是 段 寄 存 器 内 的 值 是 0xBBBBBB， 第 二 个 程序 的 地 址 将 是 0xBBBBBB 
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3572468。 因 此 ， 两 个 程序 访问 同一 个 逻辑 地 址 ， 然 而 得 到 两 个 不 同 的 VSID 。 这 就 解释 了 局 
部 变量 #1 如 何 能 在 两 个 不 同 的 程序 中 拥有 不 同 的 存储 地 址 。 


逻辑 地 址 (用 位 表示 ) [|] 


11 位 28 位 
[ (16 位 ) 
虚拟 段 标识 符 
(52 位 ) 
[一 (40 位 ) 偏 移 量 (12 位 ) 
页 表 (20 位 ) 
物理 地 址 (32 位 ) 


图 5-4 理想 的 类 PowerPC 的 虚拟 存储 结构 图 


当然 ， 还 没有 计算 机 拥有 252B 存 储 器 〈( 即 4PB )。 目 前 的 物理 存储 器 实际 上 还 要 通过 另外 
一 个 表 来 访问 。 物 理 存储 器 被 分 为 页 面 ， 每 个 页 面 大 小 是 4196 字 节 〈22B ) 。 每 个 52 位 的 虚拟 
地 址 可 以 被 认为 由 40 位 的 页 标识 符 (这 是 一 个 24 位 VSID 和 一 个 从 最 初 逻 辑 地 址 中 截取 的 16 位 
页 标识 符 ) 和 一 个 12 位 的 页 内 偏 移 量 构成 。 计 算 机 保存 一 组 页 表 ， 实 质 上 是 哈 希 表 ， 用 一 个 
20 位 数 作为 每 页 的 物理 位 置 。 通 过 查 表 ，40 位 的 页 标识 符 被 转换 为 20 位 的 物理 页 地 址 。 在 这 
个 过 程 的 最 后 ， 最 终 的 32 位 物理 地 址 只 是 页 地 址 再 加 上 偏 移 量 。 

这 并 不 像 听 起 来 那么 令 人 困惑 ， 尤 其 是 当 你 看 了 图 5-4 以 后 。 不 过 这 里 可 能 涉及 了 大 量 工 
作 。 计 算 机 为 什么 要 进行 这 样 的 过 程 ? 这 样 做 有 几 个 好 处 。 首 先 ， 不 是 每 个 虚拟 存储 器 的 页 
面 都 需要 被 保存 在 物理 存储 器 中 。 当 页 面 不 经 常 使 用 时 ， 可 以 将 它们 换 出 ， 然 后 将 它们 保存 
在 长 和 久 的 存储 设备 中 ， 例 如 硬盘 。( 这 是 谈论 “虚拟 存储 ”的 最 初 原因 ， 即 计算 机 能 够 访问 并 
非 实际 的 内 存单 元 ， 而 是 硬盘 。 这 使 得 计算 机 以 速度 损失 为 代价 来 运行 比 物理 存储 空间 大 得 
多 的 程序 。) 另外 一 个 好 处 就 是 通过 改变 段 寄 存 器 内 的 数值 ， 同 一 逻辑 地 址 可 以 指向 不 同 的 物 
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理 地 址 。 最 后 ， 基 于 按 页 处 理 的 方式 也 在 一 定 程度 上 增加 了 安全 性 。 页 表 中 的 指定 页 能 够 标 
记 为 “管理 独 有 ”， 这 意味 着 只 有 管理 级 程序 能 够 在 该 页 面 进行 读 出 或 写 入 。 类 似 地 一 个 页 面 
也 可 以 被 标记 为 “只 读 ”( 程 序 能 从 该 页 面 读 出 数据 但 不 能 向 该 页 面 写 人 数据 ) ，“ 只 有 管理 
者 写 ”( 用 户 级 程序 能 够 从 中 读 取 数 据 ， 但 是 只 有 管理 级 程序 才能 写 人 ) ， 或 者 “ 读 / 写 ”全 
都 包含 〈 任 何 程序 可 对 该 页 进行 读 / 写 ) 。 这 将 防止 用 户 程序 误 写 操作 系统 的 重要 数据 。 


5.4 外 设 优化 


5.4.1 忙 -等 待 问题 

为 了 最 佳 地 发 挥 外 设 的 性 能 ， 外 设 一 定 不 能 阻止 CPU 做 其 他 有 用 的 事情 。 计 算 机 如 此 的 快 
速 以 至 于 它们 几乎 比 任何 其 他 的 物理 过 程 速度 都 更 快 。 举 一 个 简单 的 例子 ， 一 位 熟练 的 打字 
员 每 分 钟 能 键入 120 个 字 ， 这 意味 着 大 约 每 十 分 之 一 秒 键 入 一 个 字符 。 一 台 1GHz 的 计算 机 在 两 
次 按键 之 间 能 够 完成 100，000，000 个 数 的 加 法 。 因 此 ， 计 算 机 应 该 能 够 在 执行 字 处 理 程序 的 
同时 去 做 很 多 数字 处 理 操作 。 但 是 计算 机 在 进行 操作 时 如 何 能 够 及 时 地 响应 键盘 的 请 求 呢 ? 

处 理 这 一 问题 的 一 个 笨 方 法 就 是 轮 询 ， 定 期 查看 是 否 有 事情 发 生 。 用 高 级 伪 代 码 可 将 这 
个 操作 描述 如 下 ; 

while ( 役 有 键 按 下 ) 

等 待 一 会 儿 

辨识 出 按 下 什么 键 并 且 做 相关 的 事情 

轮 询 不 能 有 效 地 利用 CPU， 因 为 CPU 不 得 不 花费 很 多 时 间 反 复 确定 是 否 有 事情 发 生 了 。 
这 也 是 为 什么 轮 询 有 时 被 称 为 忙 -等 待 ， 因 为 计算 机 忙于 等 待 按键 而 不 能 做 任何 其 他 有 用 的 
工作 。 


5.4.2 中断 处 理 

处 理 期 待 中 的 未 来 事件 的 更 聪明 的 方法 是 建立 一 个 程序 密切 监视 事件 的 发 生 并 且 做 相关 
的 处 理 。 当 事件 发 生 时 ，CPU 将 中 断 当 前 的 任务 ， 然 后 利用 先前 建立 的 程序 去 处 理 该 事件 。 

这 就 是 大 多 数 计算 机 如 何 处 理 期 待 但 不 可 预知 事件 的 一 般 做 法 。CPU 建 立 多 个 不 同 种 类 
的 中 断 信 号 ， 中 断 信号 由 预先 规定 的 事件 产生 ， 例 如 按键 。 当 此 类 事件 发 生 时 ， 标 准 的 取 指 - 
执行 周期 要 有 些 变化 。CPU 不 再 加 载 并 执行 PC 所 指 的 下 一 条 指令 ， 而 是 查阅 包含 中 断 程序 位 
置 的 中 断 向 量 表 。 然 后 将 控制 转移 (就 好 像 通过 ca11 或 jsr 转 向 一 个 子 例 程 一样 ) 到 该 位 置 ， 
专用 的 中 断 处 理 程序 将 被 执行 以 便 完成 所 需 的 任何 处 理 。( 在 具有 标准 编程 模式 的 计算 机 中 ， 
这 一 控制 也 标志 着 从 用 户 模式 切换 到 管理 模式 。) 在 中 断 处 理 程序 的 最 后 ， 计 算 机 返回 (就 像 
从 子 程 序 中 返回 ) 到 主任 务 。 

在 大 部 分 计算 机 中 ， 可 能 的 中 断 编号 是 从 0 到 一 个 小 的 数值 〈 比 如 10)。 这 些 数 与 编 人 到 
中 断 向 量 表 中 的 位 置 对 应 。 当 0 号 中 断 发 生 时 ，CPU 就 会 跳 转 到 中 断 向 量 表 中 的 位 置 0x00， 并 
且 执 行 该 处 所 存储 的 代码 。 如 果 1 号 中 断 发 生 ，CPU 则 跳 至 0x01， 依 此 类 推 。 通 常 ， 向 量 表 内 
的 中 断 位 置 处 保存 的 只 是 一 条 转移 指令 ， 用 来 将 控制 转移 到 真正 完成 实际 工作 的 代码 块 上 。 

这 种 中 断 处 理 机 制 也 可 以 推广 到 系统 内 部 事件 的 处 理 。 例 如 ，CPU 分 时 可 以 通过 设立 一 
个 内 部 定时 器 进行 控制 (这 类 定时 器 如 何 工作 的 细节 将 在 第 九 章 讨论 )。 当 定时 器 到 达 福 计时 ， 
就 会 产生 一 个 中 断 ， 致 使 计算 机 首先 从 用 户 模式 切换 到 管理 模式 ， 然 后 跳 转 到 中 断 处 理 程序 ， 
并 由 中 断 处 理 程序 将 当前 程序 环境 上 下 文 换 出 ， 然 后 换 入 接 下 来 要 执行 程序 的 上 下 文 。 定 时 
器 然后 可 以 重启 ， 并 且 为 新 的 程序 恢复 计时 。 
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5.4.3 与 外 设 的 通信 : 利用 总 线 

正如 第 一 章 所 讨论 ， 数 据 必定 要 在 CPU、 主 存 和 外 设 之 间 通 过 一 条 或 多 条 总 线 移动 。 这 
好 比 可 通过 多 条 路 从 你 家 到 商店 ， 行 程 可 能 快 一 些 或 者 慢 一 些 ， 它 取决 于 道路 的 质量 、 司 机 
的 技能 以 及 交通 流量 。 无 论 是 计算 机 还 是 购物 者 ， 都 希望 行程 尽 可 能 地 快 。 

关于 总 线 的 典型 使 用 有 两 个 关键 的 问题 。 第 一 ， 从 电气 角度 讲 ， 总 线 通常 就 是 将 所 有 部 
件 同时 连 在 一 起 的 一 组 线 。 这 意味 着 总 线 担 当 了 小 规模 的 广播 媒介 ， 挂 接 在 总 线 上 的 每 个 外 
设 可 以 在 同一 时 间 获 得 同样 的 信息 。 第 二 ， 一 个 时 刻 只 能 有 一 个 设备 向 总 线 发 出 信息 ， 如 果 
键盘 和 硬盘 都 要 向 总 线 发 送 数据 ， 那 么 谁 也 不 能 成 功 发 送 。 要 成 功 地 利用 总 线 ， 各 部 分 都 需 
要 遵循 戒律 。 这 个 戒律 以 严谨 的 通信 协议 的 形式 表现 。 一 个 典型 的 总 线 协议 可 以 包括 CPU 发 
出 一 个 开始 START 消 息 ， 然 后 发 出 某 个 设备 的 标识 。 总 线 上 的 每 个 设备 都 能 收 到 这 两 个 消息 ， 
但 是 只 有 指定 的 设备 会 响应 〈 一 般 会 用 ACKNOWLEDGE 应 答 ) 这 个 消息 。 所 有 其 他 的 设备 
都 被 这 个 START 消 息 警 示 不 能 进行 通信 ， 直 到 CPU 完 成 并 且 发 出 类 似 STOP 停 止 消息 。 此 时 只 
有 CPU 和 指定 的 设备 允许 使 用 总 线 ， 这 样 就 减少 了 竞争 和 交通 流量 问题 。 


5.5 本章 回顾 


“作为 虚拟 机 ，JVM 不 受 基于 物理 芯片 体系 结构 在 设计 和 性 能 方面 的 实际 影响 限制 。 

“ 随 着 心 片 市 场 的 竞争 ， 工 程 师 们 已 经 开发 了 很 多 技术 以 便 获 取 芯 片 的 最 佳 性 能 。 这 包括 
在 安全 和 速度 两 方面 的 改进 。 

* 一 种 获得 用 户 级 性 能 的 方式 是 改善 芯片 的 基本 指标 数字 一 一 大 小 、 速 度 和 延 时 ， 但 这 通 
常 是 一 个 困难 并 且 昂 贵 的 过 程 。 

“另外 一 种 改善 系统 性 能 的 方式 (从 用 户 角度 ) 就 是 允许 在 一 个 时 刻 执行 多 道 程序 。 通 过 
分 时 ， 计 算 机 能 够 做 到 这 一 点 ， 这 里 程序 在 非常 短 的 瞬间 执行 ， 并 且 程 序 会 换 入 换 出 。 
* 当 工程 师 们 知道 在 所 设计 的 计算 机 上 运行 何 种 程序 时 ， 他 们 就 能 针对 这 些 程 序 创建 专用 
指令 和 硬件 。 计 算 机 游戏 就 属于 这 样 的 程序 ， 游 戏 程序 对 于 计算 机 的 图 形 处 理 能 力 有 特 
别 的 需求 。Pentium 处 理 器 就 提供 基本 的 机 器 级 指令 以 便 加 速 图 形 性 能 。 

“ 一 个 时 刻 执 行 多 条 指令 的 并 行 也 能 提高 性 能 。 在 同时 执行 的 指令 种 类 方面 ，SIMD 并 行 
不 同 于 MIMD 并 行 。 

* 取 指 - 执 行 周 期 被 分 为 若干 阶段 ， 每 个 阶段 独立 并 且 同 时 执行 ， 这 种 被 称 为 流水 化 的 并 
行 形式 能 够 带 来 显著 的 性 能 增强 。 例 如 ， 在 执行 一 条 指令 的 同时 去 取 下 一 条 指令 ， 即 便 
存在 延迟 ， 计 算 机 也 能 够 获得 对 吞吐 率 100% 的 提高 。 

“超标 量 体 系 结构 将 整个 流水 阶段 复制 若干 次 ， 借 助 于 同时 做 若 于 同样 的 事情 来 提供 另外 
一 种 加 速 处 理 的 方式 。 

“通过 采用 cache 存 储 器 加 速 访问 经 常 使 用 的 数据 能 够 减少 存储 器 访问 时 间 。 

“存储 器 管理 技术 ， 如 虚拟 存储 器 和 换 页 ， 能 使 计算 机 更 快 并 且 更 安全 地 访问 更 大 容量 的 
存储 器 。 

*。 中断 取得 了 显 落 的 性 能 提高 ， 避 免 了 计算 机 检测 是 否 有 预期 事件 发 生 而 浪费 时 间 。 
“设计 适合 的 总 线 协 议 能 够 加 速 计算 机 内 部 数据 传送 ， 减 少 对 传输 时 间 片 的 竞争 。 


5.6 习题 
1. 实际 计算 机 的 哪些 存储 限制 是 JVM 堆 栈 能 够 忽略 的 ? 
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> 


a. 128 位 的 CPU 与 64 位 CPU 相 比 有 何 优势 ? 

b. 这 些 优 势 有 什么 重要 意义 ? 

一 条 保存 主 存 栈 全 部 内 容 并 且 从 主 存 检索 内 容 的 专用 指令 对 于 JVM 有 帮助 吗 ? 
如 果 由 你 负责 ， 你 打算 对 JVM 体 系 结构 做 何 增强 ? 为什么? 

除了 课本 中 提 到 的 内 容 ， 给 出 两 个 实际 的 流水 化 示例 。 

你 如 何 将 转移 预测 应 用 到 1ookupswitch 指 令 ? 

.除了 课本 中 提 到 的 内 容 ， 给 出 两 个 超标 量 处 理 的 实际 示例 。 
.cache 如 何 决 定 保 存 什么 内 容 以 及 删除 什么 内 容 ? 

9. 解释 存储 管理 如 何人 允许 两 个 程序 同时 使 用 同一 个 存储 位 置 却 没有 冲突 ? 

10. 存储 器 上 映像 UO 与 虚拟 存储 系统 是 如 何 交互 的 ? 


oo 
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6.1 背景 


1981 年 IBM 发 布 了 它 的 第 一 代 个 人 计算 机 ， 此 后 得 到 广 为 应 用 并 且 各 种 机 型 被 统称 为 
IBM-PC。 作 为 一 个 相对 低 成 本 的 计算 机 ， 并 且 由 家 喻 户 晓 的 IBM 公 司 生产 (尽管 Apple 公 司 
已 经 存在 ， 但 是 只 限于 爱好 者 市 场 ， 当 时 几乎 没有 其 他 的 计算 机 公司 存在 )， 它 取得 了 巨大 的 
成 功 ， 几 乎 立刻 占领 了 微型 计算 机 的 购买 市 场 。 

当时 计算 机 只 有 64K 内 存 ， 没 有 硬盘 ， 人 们 只 能 从 5 英寸 软盘 上 向 计算 机 加 载 程 序 。 这 
个 计算 机 内 部 的 芯片 是 由 Intel 公 司 制造 的 ， 型 号 是 8088。 今 天 ，8088 的 后 代 计 算 机 仍然 基于 
最 初 的 8088 设 计 。 

从 技术 上 讲 ，8088 是 第 二 代 芯 片 ， 它 基于 先前 的 8086 设 计 。 两 个 芯片 之 间 的 区 别 很 小 ; 
都 是 16 位 计算 机 ， 段 式 存储 器 体系 结构 。 其 主要 不 同 在 于 8086 有 一 个 16 位 的 数据 总 线 ， 所 以 
一 个 寄存 器 的 全 部 内 容 可 由 一 个 总 线 操作 送 至 存储 器 。8088 只 有 8 位 数据 总 线 ， 所 以 从 CPU 到 
存储 器 之 间 的 存储 或 加 载 操 作 需 要 的 时 间 要 长 一 些 ， 但 是 8088 芯 片 的 生产 成 本 要 便宜 一 些 ， 
这 就 降低 了 IBM-PC 的 整体 价格 (因此 提高 了 其 市 场 份额 )。 

随 着 基于 8088 的 IBM-PC 的 成 功 ，Intel 和 IBM 有 了 一 个 稳固 的 市 场 并 且 改 进 了 芯片 。 
80286 (尽管 80186 也 有 设计 ， 但 它 在 个 人 计算 机 市 场 上 销售 一 直 不 看 好 ) 将 安全 特性 融入 了 
不 安全 的 8088， 并 且 运 行 的 速度 也 比 8088 快 很 多 。80286 芯 片 是 IBM-PC/AT (Advanced 
Technology， 先 进 技术 ) 的 基础 ， 也 被 称 为 PC/AT。 

80386 增 加 了 寄存 器 的 数量 ， 并 且 寄 存 器 的 位 数 都 变 大 了 (每 个 都 是 32 位 )， 这 使 得 芯片 
能 力 更 强 。 随 后 的 80486 和 Pentium (又 名 80586) 又 有 进一步 的 改进 ， 这 将 在 第 8 章 中 详细 讨 
论 。 这 些 后 期 的 芯片 ， 加 上 最 初 的 芯片 ， 通 常 被 称 为 80x86 系 列 。 

从 菜 种 意义 上 说 ，8088 只 是 一 道 历史 风景 ， 即 便 作为 低 成 本 的 微 控 制 器 (例如 ， 这 类 芯 
片 可 以 算出 如 何 烘 烤 面 包 ， 或 者 电梯 应 停 在 哪 层 )， 它 仍 可 与 其 他 基于 更 现代 原理 和 技术 的 体 
系 结构 比美 。 然 而 ，Intel 80x86 系 列 的 后 代 产 品 为 了 维护 已 有 用 户 的 利益 都 遵循 向 后 兼容 的 原 
则 。 例 如 ， 在 1995 年 ， 当 Pentium 发 布 时 ， 上 百 万 人 正在 他 们 已 有 的 80486 系 统 上 运行 软件 。 
Intel 设 计 者 们 没有 强迫 人 们 去 购买 新 的 软件 以 及 新 的 硬件 (这 可 能 导致 他 们 从 其 他 的 公司 购 
买 软件 和 硬件 ， 如 Apple)， 而 是 确保 为 486 编 写 的 程序 仍然 能 够 在 Pentium 上 运行 。 由 于 这 个 
决定 在 各 个 阶段 都 没有 改变 ， 这 使 得 在 1981 年 为 IJBM-PC 编 写 的 程序 仍然 能 够 在 现代 的 P4 上 运 
行 。 当 然 ， 它 们 无 法 利用 现代 技术 的 改进 之 处 ， 例 如 速度 的 增加 〈 最 初 的 PC 以 4MHz 运 行 ， 
而 现代 系统 的 运行 速度 是 它 的 1000 倍 ) ， 改 善 的 图 形 分 辨 率 ， 甚 至 现代 设备 的 使 用 ， 如 鼠标 、 
USB 设 备 等 。 由 于 向 后 兼容 的 特性 ， 理 解 8088 对 于 理解 现代 Pentium 体 系 结构 仍然 是 重要 的 。 


6.2 组织 和 体系 结构 


6.2.1 ”中央 处 理 单元 
在 总 体 抽象 层次 上 看 ，Intel 8088 CPU 和 大 多 数 其 他 处 理 器 非常 相像 ， 包 括 JVM (图 6-1)。 


96 种 二 郊 分 韶 实 计算 机 


数据 保存 在 一 组 通用 寄存 器 中 ， 由 取 入 到 控制 器 并 且 在 控制 单元 中 被 译 码 的 指令 对 数据 进行 
操作 ， 并 遵循 ALU 电 路 所 定义 的 算术 运算 法 则 。 不 过 存在 一 些微 妙 但 很 重要 的 差别 。 

第 一 个 差别 就 是 由 于 8088 是 物理 芯片 ， 它 的 能 力 ( 例 如， 寄存 器 的 数量 ) 是 固定 不 变 的 。 
8088 包 含 8 个 所 谓 的 “通用 寄存 器 ” 。 不 像 JVM 栈 ， 这 些 通用 寄存 器 并 未 以 特别 的 方式 被 组 织 ， 
它们 以 名 字 而 不 是 编号 命名 。 这 些 寄存 器 命名 为 

AX BX CX DX 

SI DI BP SP 


尽管 它们 被 称 为 通用 寄存 器 ， 但 是 大 多 数 寄存 器 都 与 附加 的 硬件 有 关 ， 以 便 某 些 操作 执 
行 得 快 一 些 。 例 如 ，CPU 有 专用 的 指令 使 用 
CX 作为 循环 计数 器 ，AX/DX 是 唯一 用 于 优化 
整 型 乘法 和 除法 的 寄存 器 对 。SI 和 DI 寄 存 器 
支持 高 速 存储 器 传输 (SI 和 DI 分 别 代表 源 索 
引 和 目标 索引 ) ， 而 BP 寄 存 器 常 被 用 于 栈 指令 
指向 局 部 函数 变量 和 局 部 参数 。 

除了 这 些 寄存 器 ，8088 还 有 一 些 特殊 用 
途 的 寄存 器 ， 它 们 不 用 于 一 般 的 计算 中 。 这 
些 寄存 器 中 最 重要 的 是 IP (指令 指针 ) 寄存 
器 ，IP 保 存 将 要 执行 的 下 一 条 指令 的 地 址 。 
(在 其 他 的 机 器 中 ， 这 个 寄存 器 可 能 被 称 为 程 
序 计数 器 或 者 PC， 它 们 的 意义 相同 。) 四 个 自 
寄存 器 (CS，SS，DS 和 ES) 用 于 支持 访问 
更 多 的 存储 器 ， 并 且 使 得 对 存储 器 的 访问 结 
构 化 。 最 后 FLAGS 寄 存 器 保持 一 组 单独 的 位 
描述 当前 运算 的 结果 ， 如 上 一 个 操作 结果 是 
否 为 0 或 正 数 ， 亦 或 是 一 个 负数 。 

这 些 寄存 器 都 是 16 位 宽 。 这 意味 着 8088 一 一 一 一 一 一 一 一 一 一 一 一 一 
有 一 个 16 位 的 字 宽 ， 大 部 分 操作 能 够 进行 16 图 6-1 8088CPU 示 意图 
位 处 理 。 如 果 由 于 某 些 原因 程序 员 想 要 使 
用 小 一 些 的 表示 ， 程 序 员 可 以 使 用 通用 寄 
存 器 的 一 部 分 。 例 如 ，AX 寄 存 器 可 以 被 划 
分 为 两 个 8 位 的 寄存 器 使 用 ， 它 们 被 称 为 AH 寄 存 器 (8 位 宽 ) 
AH (高 ) 和 AL ( 低 ) 寄存 器 (图 6-2)。 所 国 6 2 8088 中 容 在 名 划分 
有 的 子 部 分 构成 同一 个 完整 的 寄存 器 ， 所 
以 任 一 部 分 的 变化 都 会 影响 整个 寄存 器 的 数值 。 如 果 你 向 AX 寄 存 器 加 载 数值 0x5678， 这 将 会 
给 AL 赋值 0x78， 而 给 AH 赋值 0x56。 类 似 地 ， 此 时 将 AL 清 零 就 会 使 AX 寄 存 器 的 内 容 变 为 
0x5600。 这 种 划分 对 于 所 有 的 通用 寄存 器 都 成 立 ，BX 寄 存 器 可 以 被 划分 为 BH 和 BL 寄存 器 ， 
等 等 


数据 段 
代码 段 (CS) 





栈 段 (SS) 
RE 





8088 寄 存 器 中 几乎 所 有 的 值 都 是 以 16 位 有 符号 补 码 形式 表示 的 。 不 同 于 JVM，8088 也 支持 
无 符号 整 型 表示 。 在 大 多 数 操作 中 〈 例 如， 移动 数据 ， 比 较 两 个 位 模式 是 否 相同 ， 甚 至 是 两 个 
数 相 加 ) ，8088 并 不 关心 给 定 的 位 模式 是 有 符号 还 是 无 符号 的 量 ， 但 是 少数 情况 下 存在 两 种 不 
同 的 操作 。 例 如 ， 两 个 无 符号 相 乘 使 用 助 记 符 MUL;， 而 两 个 有 符号 量 相 乘 则 使 用 助 记 符 IMUL。 
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上 述 定义 的 寄存 器 用 于 8088 计 算 机 可 完成 的 大 部 分 操作 ， 从 存储 器 访问 到 控制 结构 和 循 
环 ， 以 及 高 速 整 型 处 理 。 关 于 高 速 浮 点 处 理 ， 设 计 了 一 个 独立 的 芯片 作为 浮 点 单元 (FPU ) 。 
这 个 FPU 有 它 自己 的 8 个 寄存 器 ， 每 个 寄存 器 80 位 宽 用 于 高 精度 运算 ， 并 以 栈 的 方式 组 织 。 保 
存在 这 些 寄存 器 中 的 数据 采用 专用 的 浮 点 表示 ， 与 前 面 讨论 的 标准 相似 ， 只 是 尾数 和 指数 的 
位 数 较 多 。 还 有 一 些 附 加 的 寄存 器 ， 两 者 都 是 FPU 的 一 部 分 (例如 ，FPU 有 它 自己 的 指令 寄存 
器 ) 并 且 用 于 某 些 专用 运算 。 


6.2.2 取 指 -执行 周期 

8088 的 取 指 -执行 周期 与 VM 的 几乎 相同 ，IP 寄 存 器 中 的 数值 用 于 表示 存储 器 地 址 ， 该 地 
址 (由 IP 寄 存 器 指示 ) 中 的 数值 被 拷贝 ( 取 ) 到 指令 寄存 器 中 。 指 令 一 旦 被 取出 ，IP 寄 存 器 
内 的 数值 即 增 1 (指向 下 一 条 指令 )， 取 出 的 指令 由 CPU 执 行 。 

唯一 的 限制 就 是 IP 寄 存 器 自身 的 容量 。 由 于 只 有 16 位 宽 ，IP 寄 存 器 只 能 访问 65000 个 不 同 
的 地 址 ， 因 此 最 多 取得 65000 条 不 同 的 指令 。. 这 看 起 来 限制 了 程序 的 大 小 ， 没 有 程序 能 够 超出 
64K。 幸 运 的 是 ， 下 一 节 描 述 的 存储 管理 技术 稍 许 缓解 了 这 个 限制 ， 实 际 上 是 借助 其 他 寄存 器 
的 附加 位 来 扩大 地 址 空间 。 


6.2.3 ”存储 器 

对 于 一 个 16 位 字 宽 的 计算 机 ， 每 个 寄存 器 可 容纳 25 ( 约 65000) 个 模式 。 这 意味 着 任何 寄存 器 
(例如 ， 了 正 ) 拥有 的 存储 器 地 址 可 以 指向 65000 个 不 同 的 位 置 ， 以 现代 的 标准 看 这 绝对 不 够 ， 简 直 枉 
费 我 们 的 努力 。( 来 做 一 个 快速 的 现实 核查 : 排版 这 本 书 的 文本 处 理 软件 占用 了 251864 个 存储 器 位 
置 ， 这 还 不 包括 编辑 和 打印 软件 .) 即使 在 1981 年 ，64K 字 节 存 储 器 也 被 认为 是 非常 小 的 容量 。 

关于 这 一 问题 有 若干 解决 方案 。 最 容易 的 方案 是 使 每 个 模式 /访问 位 置 不 指向 单一 的 存储 
器 字 节 ， 而 是 字 (或 者 是 更 大 的 单元 )。 这 在 保存 一 个 比 字 小 的 数据 项 (如 字符 串 中 的 字符 ) 
时 会 降低 效率 ， 但 是 却 使 访问 更 多 的 存储 器 成 为 可 能 。 

8088 设 计 者 采用 稍 加 复杂 的 方法 。8088 的 存储 器 被 分 割 为 64KB 的 段 。 每 个 段 包 含 普通 16 
位 寄存 器 能 最 多 访问 到 的 存储 器 字 节 ， 但 是 这 些 地 址 被 解释 为 相对 基地 址 ， 基 地 址 由 特有 的 
段 定 义 。 顾 名 思 义 ， 段 定义 保存 在 所 谓 的 段 寄 存 器 中 。 

遗憾 的 是 ， 数 学 在 这 一 点 上 也 很 难处 理 。 段 寄存 器 本 身 是 16 位 宽 。 真 正 的 《有 时 称 为 绝 
对 的 ) 地 址 是 由 相关 的 段 寄存 器 值 乘 以 16 (等 价 于 左 移 4 个 二 进 制 位 置 , 或 一 个 十 六 进 制 位 置 ) 
再 与 相应 的 通用 寄存 器 或 了 P 中 的 值 〈 称 为 偏 移 量 ) 相 加 。 例 如 ， 如 果 段 寄存 器 中 保存 的 值 是 
0xC000， 这 将 定义 段 从 0xC0000 开 始 。 偏 移 量 0x0000 将 对 应 (20 位 ) 位 置 0xC0000， 而 偏 移 
量 0x35A7 将 对 应 绝对 位 置 0xC35A7， 这 些 位 置 中 的 每 一 个 都 对 应 一 个 字 节 。 

关于 段 的 起 始 一 定 与 64K 的 倍数 对 齐 并 没有 特别 的 理由 。 加 载 数 值 0x259A 将 定义 段 的 起 
始 地 址 为 0x259A0。 事 实 上 ， 任 何 一 个 以 十 六 进 制 值 0 结尾 的 位 置 都 是 一 个 可 能 的 段 起 始 地 址 。 
在 上 述 定义 的 段 中 ， 段 值 0x259A 加 上 假定 的 偏 移 量 


C000:35A7 
0x8041 会 生成 绝对 地 址 (0x259A0+0x8041) 或 者 字 节 地 址 自信 禄 


位 置 0x2D9E1。 为 了 简化 起 见 ， 这 样 的 地 址 对 通常 被 写 、 t 

成 段 : 偏 移 量 的 形式 ， 例 如 259A : 8041。 在 这 种 模式 中 ， cllofole) 
合法 地 址 从 0x00000 (0000 : 0000) 到 0xFFFFF (F000 : +[3|s5|al7| 
FFFF)。 应 该 注意 的 是 ,通常 有 很 多 段 : 偏 移 量 对 指向 -一 人 一 
给 定 的 位 置 。 位 置 F000 : FFFF 也 是 位 置 FFFF : 000F， 实际 地 址  C 3 5 A7 


同样 也 是 位 置 F888 : 777F (如 图 6-3) 。 图 6-3 段 : 偏 移 计算 图 示 
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按 通 常 的 习惯 ， 四 个 段 寄存 器 与 不 同 的 偏 移 量 寄存 器 联合 定义 不 同 的 存储 类 型 及 应 用 。 
它们 对 应 于 

“CS (代码 段 ) ;代码 段 寄 存 器 与 IP 联合 定义 机 器 可 执行 的 指令 (程序 代码 ) 在 存储 器 中 

的 位 置 。 

"DS (数据 段 )， 数据 段 寄存 器 与 通用 寄存 器 AX，BX，CX 和 DX 联合 控制 对 全 局 程序 数 

据 的 访问 。 

“SS 〈 栈 段 ) : 栈 段 寄存 器 与 栈 寄存 器 (SP 和 BP) 联合 定义 栈 帧 ， 函 数 参数 和 局 部 变量 ， 

下 面 将 要 讨论 这 个 内 容 。 

*ES 〈 附 加 段 ) : 附加 段 寄 存 器 用 于 保持 额外 的 段 。 例 如 ， 如 果 一 个 程序 太 大 不 能 装 在 单 

独 一 个 代码 段 中 。 

即使 采用 段 式 存储 器 模型 ， 计 算 机 也 只 能 访问 22 个 不 同 的 位 置 ， 即 IMB 。 即 便 这 些 存储 
空间 在 实际 中 也 不 是 完全 都 可 使 用 的 ， 因 为 一 些 空间 被 预 留 给 视频 存储 而 不 是 通用 的 程序 存 
储 。 实 际 上 ， 程 序 员 只 能 访问 前 512K 用 于 程序 的 空间 。 幸 运 的 是 ， 当 计算 机 存储 器 超出 1MB 
在 财力 上 成 为 可 行 的 时 候 ，8088 的 设计 已 经 被 同系 列 的 后 代 产 品 超越 了 ， 包 括 Pentium 。 
Pentium 中 存储 器 访问 有 了 很 大 的 不 同 ， 从 某 种 意义 上 避免 了 1MB 的 限制 。 


6.2.4 设备 和 外 设 

现代 计算 机 能 够 附带 一 批 外 围 设 备 ， 从 简单 的 键盘 和 显示 器 ， 到 商业 附件 如 扫描 仪 和 传 
真 机 ， 以 及 真正 的 非 普 通 专用 设备 如 售 货 机 、 烤 箱 以 及 医学 影像 设备 。 由 于 基于 80x86 的 机 器 
如 此 普遍 ， 因 此 设计 并 制 成 与 8088 接 口 的 设备 很 常见 。 

然而 ， 从 计算 机 (以 及 计算 机 设计 者 ) 的 视角 ， 通 过 采用 标准 化 的 接口 设计 和 端口 ， 任 
务 从 一 定 程度 上 得 到 了 简化 。 例 如 ， 很 多 计算 机 的 主板 上 带 有 IDE 控 制 器 芯片 ， 并 且 IDE 控 制 
器 直接 与 系统 总 线 连接 。 这 个 IDE 控 制 器 同时 附带 一 组 连 线 ， 这 组 连 线 可 以 插入 IDE 形 式 的 驱 
动 器 。 当 该 控制 器 从 系统 总 线 上 获得 相应 的 信号 ， 它 负责 解释 这 些 针 对 某 个 驱动 器 的 信号。 
所 有 硬盘 制造 商都 能 完全 确保 它们 遵从 IDE 规 范 并 且 适 应 任何 PC。PCI (Peripheral 
Component Interconnection 外 围 组 件 互 连 ) 规定 了 类 似 的 标准 化 , 将 主板 与 各 种 设备 直接 连接 。 
也 许 最 广 为 使 用 的 连接 是 USB (Universal Serial Bus 通 用 串 行 总 线 ) 连接 。 这 为 任何 支持 USB 
的 设备 (从 鼠标 到 打印 机 ) 提供 了 标准 化 的 高 速 连接 。USB 控 制 器 本 身 会 查询 关联 其 上 的 任 
何 设备 ， 发 现 它们 的 名 称 、 类 型 以 及 它们 要 做 什么 (以 及 它们 如 何 做 )。USB 端 口 也 能 提供 能 
源 ， 并 且 几 乎 以 网 络 的 速度 与 这 些 设备 通信 。 然 而 ， 从 程序 员 的 视角 ，USB 的 优势 是 程序 员 
只 需 编 写 程序 与 USB 控 制 器 通信 ， 大 大 地 简化 了 与 设备 通信 的 任务 。 


6.3 ”汇编 语言 


6.3.1 操作 和 寻 址 

8088 在 教科 书 中 是 一 个 CISC (Complex Instruction Set Computing 复 杂 指 令 集 计算 ) 典型 
示例 。CISC 中 能 执行 的 操作 集合 庞大 ， 并 且 操 作 本 身 的 功能 很 强大 。CISC 设 计 的 一 个 副作用 
是 一 些 简 单 的 功能 能 够 使 用 不 同 的 机 器 操作 以 多 种 不 同 的 方式 执行 ， 这 通常 意味 着 Intel 的 设 
计 者 们 为 某 些 寄 存 器 提供 便捷 使 用 的 优化 功能 。 

由 于 寄存 器 有 名 称 ， 不 像 在 JVM 中 使 用 编号 或 索引 ， 基 本 运算 格式 就 有 所 不 同 。 在 JVM 
中 ， 只 要 简单 地 指明 “add” 就 足够 了 ， 位 于 栈 顶 的 两 个 数 即 被 自动 相 加 ， 并 且 在 加 法 结束 时 ， 
结果 就 被 自动 地 留 在 栈 顶 。 在 8088 中 ， 情 况 就 不 同 了 ， 程 序 员 必 须 指明 加 数 被 保存 在 哪里 以 
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及 和 被 存放 在 哪里 。 
由 此 ，8088 大 多 数 指令 采用 两 变量 的 指令 格式 ， 如 下 : 
助 记 符 操作 数 1， 操 作 数 2， 可 能 的 注释 


通常 第 一 个 操作 数 被 称 为 目标 操作 数 (有 时 简写 为 dst)， 而 第 二 个 操作 数 被 称 为 源 操作 数 
(简写 为 src)。 基 本 思想 是 数据 取 自 于 源 ( 源 在 其 他 情况 下 是 不 被 改变 的 )， 而 计算 结果 保留 在 
目标 中 。 因 此 ， 对 于 CX 中 的 值 与 AX 中 的 值 相 加 ( 助 记 符 : ADD) (并 且 将 和 保存 在 AX 中 )， 
8088 汇 编 语 言 指令 将 是 

ADD AX, CX ， 真 正 的 含义 AX=AX+CX 

由 于 有 8 个 16 位 通用 寄存 器 ， 所 以 有 64 (8 x 8) 个 不 同 的 加 法 指令 。 事 实 上 ， 既 然 可 以 将 
16 位 或 者 8 位 值 相 加 ， 就 会 有 很 多 的 表示 ， 例 如 

ADD AH, BL ; AH = AH + BL 

8088 还 支持 若干 种 寻 址 方式 或 者 可 以 采用 不 同方 式 将 给 定 的 寄存 器 模式 解释 为 访问 不 同 存 
储 位 置 。 对 于 以 上 方面 ， 最 简单 的 例子 就 是 寄存 器 中 保存 的 值 就 是 计算 中 所 用 的 值 。 这 被 称 为 
寄存 器 方式 寻 址 。 与 其 相 比 ， 也 可 采用 立即 方式 寻 址 ， 这 种 方式 将 数据 本 身 写 人 程序 中 ， 如 

ADD AX, 1 ; AX=AX+1 

注意 ， 这 只 在 1 是 第 二 个 ( 源 ) 操作 数 时 才 有 意义 。 对 目标 操作 数 使 用 立即 方式 寻 址 将 会 
导致 错误 产生 。 也 应 该 注意 到 这 是 CISC 计 算 的 强势 ， 因 为 这 种 操作 在 JVM 中 将 占用 两 条 单独 
的 指令 一 一 一 条 指令 加 载 整 型 常数 1 而 另外 一 条 指令 执行 加 法 。 

立即 数 或 者 寄存 器 值 也 可 以 用 做 存储 器 地 址 ， 告 诉 计算 机 这 不 是 数值 而 是 要 找到 该 值 
的 地 址 。 例 如 ， 如 果 BX 包 含 一 个 8 位 数值 的 地 址 ， 我 们 用 下 面 的 表示 将 CL 中 的 当前 值 与 其 
相 加 。 方 括号 〈[]) 代表 寄存 器 BX 使 用 间接 方式 ( 稍 后 将 讨论 直接 方式 ) 作为 存储 单元 的 


地 址 : 
ADD CL, [BX] ;CL=CL+ 用 BX 索引 的 存储 单元 中 保存 的 什 
这 是 一 个 难点 ， 因 此 我 们 多 做 些 研究 。 注 意 下 面 两 条 指令 所 完成 的 功能 不 同 : 
ADD BX, 1 5 BX 增 1 
ADD [BX], 1 ; BX 指向 的 值 增 1 


它们 如 何不 同 ? 让 我 们 假设 存储 在 BX 中 的 值 是 4000。 执 行 第 一 个 操作 将 使 BX 中 的 值 增 
加 ， 等 于 4001。 相 比 之 下 ,第 二 个 操作 没有 改变 BX 的 值 ( 仍 为 4000)， 而 是 增加 了 保存 在 存 
储 单元 4000 中 的 值 。( 实 际 上 ， 这 里 有 一 个 错误 ， 原 因 将 在 6.4.1 节 讨论 。 本 质 上 ， 尽 管 我 们 知 
道 4000 单 元 中 有 一 个 值 ， 但 是 我 们 不 知道 它 是 字 节 ， 字 ， 双 字 ， 还 是 其 他 的 类 型 。 因 此 计算 
机 怎么 能 知道 增加 的 单位 大 小 昵 ? ) 类 似 地 ， 执 行 

ADD AX，[4000h] ; 将 4000h 中 的 值 与 AX 相 加 
查看 存储 单元 0x4000 ( 方 括号 中 的 数 由 于 尾部 的 h 被 自动 解释 为 16 进 制 的 量 ) 中 保存 的 16 位 的 
值 ， 然 后 将 其 与 AX 中 存储 的 值 相 加 。 在 这 个 例子 中 ， 没 有 涉及 寄存 器 而 是 采用 了 常数 定义 的 
存储 位 置 ， 我 们 将 此 称 为 直接 方式 。 

这 些 寻 址 方式 能 够 用 于 几乎 任意 组 合 的 ADD 操 作 中 ， 但 是 有 两 个 例外 。 例 如 ， 将 一 个 寄 
存 器 与 另外 一 个 寄存 器 相 加 ， 将 一 个 存储 单元 与 寄存 器 或 者 一 个 寄存 器 与 存储 单元 相 加 ,或 
者 将 一 个 立即 值 与 寄存 器 或 者 存储 器 内 的 值 相 加 都 是 合法 的 。 然 而 ， 将 一 个 存储 单元 与 另 一 
个 存储 单元 直接 相 加 是 不 合法 的 ， 其 中 的 一 个 操作 数 一 定 要 放 在 寄存 器 中 。 将 立即 值 作为 加 
法 的 目标 地 址 也 是 不 合法 的 。 下 面 的 一 组 操作 中 ， 前 面 的 5 个 是 合法 的 ， 而 后 面 的 2 个 是 不 合 
法 的 。 
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ADD AX, BX ; 寄存 器 -寄存 器 


ADD AX，[46000] ; 存储 器 -寄存 器 
ADD AX，4000 ; 立即 值 -寄存 器 
ADD [4000] ，AX ; 寄存 器 -存储 器 


ADD [40060] ，4666 :立即 值 -存储 器 
ADD [3000] , [4000] ， 不 合法 ! 存储 器 -存储 器 
ADD 4000, AX + 不 合法 ! 立即 值 - 任 意 


上 述 每 个 操作 以 及 寻 址 方式 都 用 略 有 不 同 的 机 器 码 表 示 。 在 机 器 码 中 ， 由 于 使 用 AX 寄 存 
器 指示 目标 的 8088 特 殊 (而 快速 ) 指令 的 存在 而 增加 了 复杂 性 。 聪 明 的 程序 员 (或 者 编译 器 ) 
利用 这 类 指令 将 数据 放 在 AX 寄 存 器 而 不 是 其 他 寄存 器 能 够 使 程序 更 快 更 短 。( 我 们 在 JVM 中 
已 经 看 到 了 这 类 指令 ， 即 用 i10ad_1 作 为 更 加 通用 的 i110ad 指 令 的 捷径 办 法 。 难 以 理解 的 是 ， 
大 多 数 汇 编 器 对 于 高 速 的 AX 指 令 不 使 用 有 区 分 的 助 记 符 ， 而 是 汇编 程序 自身 去 识别 这 个 特殊 
用 途 指 令 的 使 用 ， 然 后 自动 生成 机 器 码 。 这 意味 着 如 果 汇 编 器 足够 聪明 汇编 语言 程序 员 就 不 
必 为 这 些 指令 而 担忧 。) 这 种 为 高 速 运算 而 设计 的 寄存 器 有 时 也 被 称 为 累加 器 ， 严 格 地 说 ， 





8088 有 两 个 不 同 的 累加 器 一 一 或 者 至 少 同一 个 寄存 器 的 两 个 部 分 。AX 寄 存 器 作为 一 个 16 位 的 
累加 器 而 AL 寄存 器 用 作 一 个 8 位 的 累加 器 。 
6.3.2 算术 指令 集 

对 于 大 多 数 算数 操作 常见 的 是 两 操作 数 格式 。 例 如 ， 可 用 SUB 指 令 完 成 两 个 数 的 减法 而 
不 是 两 个 数 相 加 : 

SUB BX, AX ; BX = BX - AX 


8088 还 支持 存储 器 与 寄存 器 之 间 的 MOV 指 令 ， 也 同样 使 用 两 个 参数 的 形式 ， 其 中 第 一 个 
操作 数 是 目标 而 第 二 个 操作 数 是 源 。8088 也 使 用 同样 的 格式 支持 AND，OR 和 XOR 指 令 ， 这 
些 指令 也 都 有 专用 的 累加 器 捷径 。 

也 有 一 些 一 个 参数 的 指令 ， 例 如 INC ( 自 增 )，DEC ( 自 碱 )，NEG ( 求 反 一 一 即 乘 以 -1) 
和 NOT (参数 所 有 的 位 变 反 ， 等 价 于 与 一 个 各 位 全 为 1 的 参量 做 XOR 运 算 操作 )。 格 式 非 常 简单 

DEC AX ;AX=AX-1 

乘法 和 除法 都 比较 复杂 。 原 因 很 简单 ， 当 你 要 两 个 16 位 整数 相 加 (比如 说 ) 时 ， 大 约会 
得 到 一 个 16 位 的 结果 ， 该 结果 仍 可 以 装 入 一 个 16 位 的 寄存 器 。 当 你 要 将 这 两 个 数 相 乘 时 ， 结 
果 就 可 能 长 达 32 位 (一 个 16 位 的 寄存 器 无 法 容纳 ) 。 类 似 地 ， 整 数 除法 实际 产生 两 个 结果 ， 商 
和 余数 〈 例 如 ， 22/5=4 余 数 2， 就 像 小 学 算术 ) 。 因 此 ，8088 为 了 乘法 和 除法 的 结果 增补 附加 
的 寄存 器 一 由 于 硬件 的 复杂 性 ，8088 只 能 使 用 一 些 针对 这 些 操作 特定 的 寄存 器 。 

要 将 两 个 数 相 乘 , 第 一 个 数 一 定 要 出 现在 累加 器 ( 适 于 任何 位 宽 ) 。 乘 法 指令 本 身 (MUL) 
有 一 个 参量 ， 该 参量 是 乘法 的 第 二 个 数 。 乘 积 表 6-1 8088 乘 法 信息 流 
被 放 在 一 个 寄存 器 对 中 ， 确 保 乘法 不 会 溢出。 
表 6-1 示 意 乘法 操作 中 信息 向 哪里 流动 以 及 如 。。 科 数 。 被 条 数 。 和 


何 流动 。 AL 参量 AH AL 
(DX-AX 寄 存 器 对 有 了 时 被 缩写 为 DX:AX， AX 参量 DX AX 
AH:AL 对 通常 缩写 为 AX 寄 存 器 。) 本 


将 两 个 数 59 和 71 作 为 16 位 值 相 乘 ， 可 用 的 代码 片断 如 下 。 首 先 ，( 十 进 制 ) 值 59 通 过 
MOV 指 令 被 加 载 到 AX 寄 存 器 ， 值 71 被 类 似 地 加 载 到 BX 寄 存 器 。 然 后 累加 器 (AX) 中 的 值 与 
BX 中 的 值 相 乘 。 结 果 将 被 留 在 DX:AX。 特 别 地 ，AX 将 保存 结果 的 低 16 位 (十进制 值 4189， 
保存 为 0x105D)， 而 DX 保存 高 16 位 ， 在 该 例 中 将 是 全 0。 
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MOV AX, 59 ; AX 获 得 乘 数 
MOV BX, 71 ; BX 获 得 被 乘 数 
MUL BX ; DX:AX=AX*BX 


实际 上 有 两 种 不 同 的 乘法 指令 ， 一 种 用 于 无 符号 整数 乘法 (MUL) 而 另 一 种 用 于 有 符号 
整数 (IMUL)。 两 种 情况 中 寄存 器 用 途 是 相同 的 ， 唯 一 区 别 是 被 乘 数 和 乘 数 的 最 高 位 被 当 作 
符号 位 还 是 数值 位 。 例 如 ， 值 0xFF (作为 8 位 的 量 ) 要 么 是 -1 (作为 有 符号 量 ) 要 么 是 255 
(作为 无 符号 量 ) 。 用 0xFF 与 其 自身 相 乘 会 导致 0xFF01 存 放 在 AX 寄 存 器 ， 而 IMUL 指 令 将 得 到 
0x0001 (因为 -1 与 其 自身 相 乘 结果 当然 是 1)。 

除法 使 用 同样 复杂 的 寄存 器 集 ， 但 是 次 序 相 反 。 被 除数 被 放 入 寄存 器 对 中 ， 要 么 是 
AH:AL 对 ， 要 么 是 DX:AX 对 。 除 法 的 参量 用 作 除 数 。 商 被 保存 在 寄存 器 对 低 半 部 分 而 余数 被 
保存 在 高 半 部 分 。 使 用 先前 的 例子 : 


MOV DX, 8 ; DX 清 零 
MOV AX, 22 ; DX:AX=22 
MOV BX, 5 ; 除数 是 5 
DIV BX ; 执行 除法 
; 现在 DX 包含 2 
; 现在 AX 包 含 4 
类 似 于 乘法 ， 除 法 也 有 两 种 指令 ，DIV 和 IDIV， 分 别 执 行 无 符号 和 有 符号 除法 。 
6.3.3 浮 点 运算 


8088 FPU 几 乎 是 单独 的 自 包 含 计算 机 ， 有 它 自己 的 寄存 器 和 特殊 的 指令 集 ， 专 门 用 来 执 
行 浮 点 操作 。 实 际 上 它 是 一 个 单独 的 自 包含 的 芯片 ， 以 型 号 8087 作 为 数学 协 处 理 器 出 售 。 数 
据 在 8088 主 CPU 和 协 处 理 器 之 间 传 送 。 未 命名 的 8087 寄 存 器 是 8 个 80 位 宽 的 存储 单元 组 成 的 栈 
(是 的 ， 就 像 JVM) ， 再 一 次 地 ， 类 似 于 JVM， 指 令 集 指 明 操 作 类 型 以 及 数据 表示 类 型 。 

FPU 能 够 保存 和 执行 3 种 不 同类 型 的 数据 : 标准 的 IEEE 浮 点 数 ， 整 数 和 专 有 格式 称 为 二 进 
制 编码 的 十 进 制 数 (BCD)，BCD 中 每 4 位 一 组 代表 一 个 十 进 制 数 字 的 二 进 制 编码 。 这 个 格式 
常 被 [BM 主机 采用 ， 因 为 对 于 工程 师 们 很 容易 将 这 个 二 进 制 模式 重新 解释 为 (直观 的 ) 十 进 
制 数 字 ， 反 之 亦 然 。 在 8087 内 部 ， 所 有 这 些 格式 都 被 转换 成 80 位 的 格式 并 且 以 80 位 格式 保存 ， 
这 在 本 质 上 比 IEEE 定 义 的 标准 格式 更 为 精确 。 

所 有 的 FPU 操 作 都 以 字母 F 开 头 〈(JVM 程 序 员 应 该 熟知 这 一 点 ) 并 且 如 人 们 所 期 望 的 对 栈 
顶 进行 操作 ， 就 像 JVM 或 者 逆 波 兰 计算 器 。FADD 指 令 弹 出 FPU 栈 顶 两 个 元 素 ， 将 它们 相 加 ， 
然后 将 结果 压 入 栈 。 其 他 的 算术 操作 包括 FSUB，FMUL 和 EDIV ， 其 功能 如 所 期 待 的 那样 。 有 
两 个 附加 操作 : FSUBR 和 FDIVR， 其 执行 反 向 的 减法 〈 除 法 ) ， 将 第 二 个 元 素 减 去 栈 顶 元 素 
而 不 是 从 栈 顶 减 去 第 二 个 元 素 。 


补充 资料 
其 他 FPU 变 量 格式 
尽管 FPU 总 是 使 用 内 部 80 位 “扩展 精度 ”格式 进行 操作 ， 数 据 在 主 存 中 却 以 多 种 形式 
取 / 存 。 在 取 / 存 时 进行 转换 ， 取 决 于 所 用 的 操作 助 记 符 。 有 很 多 不 同 的 指令 ， 大 多 数 都 有 
儿 种 解释 ， 如 下 : 


。 整 数 : 用 FILD 指 令 取 16 位 或 者 32 位 整 型 数据 。 在 后 来 的 机 器 中 ， 这 条 指令 也 能 取 64 
位 的 量 。 

。BCD 整 数 ， 用 FBLD 指 令 取 80 位 的 二 进 制 编码 的 十 进 制 格式 整 型 数据 。 

。 浮 点 数 ， 用 FLD 指 令 取 32 位 ，64 位 或 者 80 位 长 的 浮 点 数 。 

这 些 量 一 旦 取出 ， 它 们 就 被 FPU 视 为 相同 。 要 存 一 个 值 ， 在 上 述 的 助 记 符 中 用 “ST” 代 替 “LD"。 
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还 有 一 些 特 殊 指 令 (如 FSQRT) 处 理 常 用 的 数学 函数 ， 如 平方 根 和 三 角 函 数 。 

用 FLD 指 令 能 将 数据 压 和 人 ( 取 入 ) FPU 栈 。 这 实际 上 以 3 种 形式 表现 ， FLD 从 指定 的 存储 
单元 取 32 位 或 64 位 IEEE 浮 点 数 , FILD 从 存储 器 取 16 位 或 32 位 整数 (并 将 其 转换 为 内 部 浮 点 数 )， 
以 及 FBLD 从 存储 器 取 80 位 BCD 数 《并 对 其 进行 转换 )。 有 一 些 使 用 常数 的 特殊 操作 ，FLD1 取 
1，FLDZ 取 0，FLDPI 取 80 位 表示 的 x， 还 有 一 些 其 他 的 指令 指定 常用 对 数 ， 例 如 2 的 自然 对 数 。 
要 将 数据 从 FPU 移 人 存储 器 ， 采 用 FST 指 令 的 一 些 变形 -一 再 次 说 明 ， 有 对 整 型 (FIST) 和 
BCD (FBST) 存储 的 变形 。 一 些 操作 还 有 额外 的 变形 ， 尾 部 以 P 标 记 ， 当 操作 完成 时 弹出 栈 
(例如 ，FISTP 将 栈 中 的 浮 点 数 弹出 并 保存 为 整数 ) 。FPU 的 一 个 限制 是 数据 只 能 从 存储 器 取 或 
者 存 至 存储 器 ， 不 能 直接 从 ALU 寄 存 器 取 。 因 此 以 下 语句 





FILD AX ; 不 合法 ! 不 能 使 用 寄存 器 

就 是 不 合法 的 ， 存 放 在 AX 中 的 值 应 首先 移入 一 个 存储 器 字 位 置 然 后 再 从 该 位 置 取出 如 下 ; 
MOV Location, AX ; 将 AX 内 容 移 人 存储 器 

FILD Location ; 从 存储 器 取 入 FPU 


6.3.4 ”判定 和 控制 结构 

如 同 大 多 数 汇 编 语言 ，8088 的 控制 结构 建立 在 无 条 件 和 条 件 跳 转 指令 基础 上 ， 在 这 里 控 
制 被 转移 到 源码 中 声明 的 某 条 标号 语句 。 如 同 JVM， 这 一 处 理 实际 上 通过 偏 移 量 计 算 以 及 将 
程序 计数 器 当前 的 地 址 与 偏 移 量 相 加 / 减 完成 。 跳 转 指 令 ( 助 记 符 : JMP) 的 格式 对 于 我 们 来 
说 也 是 熟知 的 : 

LABEL: IMP LABEL ; 思春 的 无 限 循环 

条 件 跳 转 使 用 CPU 中 FLAGS 寄 存 器 中 的 一 组 二 进 制 标志 位 (flag) 。 这 些 标志 都 是 用 独立 
的 位 来 描述 最 近 计 算 结果 ， 例 如 ， 当 且 仅 当 最 近 操 作 (ALU 中 ) 结果 是 零 时 ， 零 标志 ZF 被 置 
位 。 符 号 标志 SF 包含 最 高 位 (如 果 结 果 是 有 符号 整数 该 位 将 是 符号 位 ) 的 副本 并 且 当 且 仅 当 
最 近 结 果 是 负数 时 该 位 被 置 位 。 当 且 仅 当 最 近 计算 产生 一 个 进位 时 ， 进 位 标志 CF 被 置 位 ，( 当 
执行 无 符号 数 计算 时 ) CF 标志 计算 结果 太 大 寄存 器 无 法 容纳 。 溢 出 标志 位 OF 处 理 类 似 的 情况 ， 
这 里 是 指 当 执行 有 符号 数 计算 时 对 于 寄存 器 来 说 太 大 (或 太 小 )。 还 有 一 些 其 他 的 标志 位 ， 但 
是 上 述 例 举 的 都 是 最 常用 的 标志 位 。 

条 件 跳 转 的 助 记 符 形 如 “Jcondition”， 这 里 “condition” 描 述 跳 转 成 功 时 的 标志 设 定 。 例 
如 ，JZ 的 含义 是 如 果 零 标志 被 置 位 则 跳 转 ， 而 JNZ 的 含义 是 如 果 零 标志 未 被 置 位 则 跳 转 。 我 
们 可 以 以 此 来 测试 两 个 值 是 否 相等 : 

SUB AX, BX ; AX = AX - BX 

Jz ISEQUAL ; 如 果 现 在 AX=0 则 设置 ZF (=1) 

; 如 果 到 了 这 里 ，AX 就 不 等 于 BX 

JMP OUTSIDE 
ISEQUAL: 

; 如 果 到 了 这 里 ，AX 等 于 BX 
OUTSIDE: 
; if/e1se 语 旬 之 后 返回 

其 他 的 条 件 跳 转 包括 JCUJNC (如 果 CF 置 位 / 清 零 则 跳 转 )，JS/JNS (如 果 SF 置 位 / 清 零 则 跳 转 )， 
JOJNO (如 果 OF 置 位 / 清 零 则 跳 转 ) ， 等 等 。 遗 憾 的 是 ， 不 是 所 有 的 标志 都 有 这 么 清晰 的 算术 
解释 ， 另 一 组 条 件 跳 转 是 处 理 算术 比较 ， 如 “大 于 ”,“ 小 于 或 者 等 于 ” ， 等 等 。 这 些 指令 采取 
与 算术 关系 相 适 的 组 合 方式 来 解释 标志 。 

更 加 详细 地 说 ， 这 些 跳 转 期 望 标志 寄存 器 包含 一 个 数 减 去 另 一 个 数 的 结果 ， 就 像 上 面 刚 
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举例 给 出 的 示例 片段 《这 是 一 个 小 谎言 ， 稍 后 会 更 加 详细 解释 CMP 指 令 )。 要 确定 一 个 有 符号 
数 是 否 比 另 一 个 大 ， 可 以 使 用 JG (如 果 大 于 则 跳 转 ) 助 记 符 。 其 他 助 记 符 包 括 苞 (如果 小 于 
则 跳 转 )，JLE (如 果 小 于 或 者 等 于 则 跳 转 ) 以 及 JGE (如 果 大 于 或 者 等 于 则 跳 转 )。 这 些 助 记 
符 也 以 取 负 的 形式 存在 一 一 JINGE (如 果 不 大 于 或 者 等 于 则 跳 转 ) ， 当 然 ， 这 等 价 于 J[ 一 一 事 
实 上 用 两 个 不 同 的 助 记 符 实现 了 同一 指令 。 类 似 地 ， 存 在 JE， 等 价 于 先前 定义 的 ]Z，JNE 与 
JNZ 相 同 。 

对 于 无 符号 整数 的 比较 ， 需 要 一 组 不 同 的 指令 。 要 理解 其 中 的 原因 ， 考 虑 16 位 的 量 
0xFFFF。 作 为 有 符号 整数 ， 它 代表 一 1， 小 于 0。 作 为 无 符号 整数 ， 它 代表 最 大 的 16 位 数 ， 略 
大 于 65000 一 一 当然 它 大 于 0。 所 以 问题 “0xFFFF>0x0000? ”有 两 个 不 同 的 答案 。 取 决 于 该 
数 是 否 为 有 符号 数 。8088 考 虑 到 这 个 问题 提供 了 一 组 条 件 转移 指令 ( 即 JA, JB, JAE, JBE,， 
JNA，JNB，JNAE，JNBE) 用 于 比较 无 符号 数 。 所 以 ， 要 判定 AX 中 保存 的 值 能 否 装 入 8 位 寄 
存 器 ,使 用 下 面 的 代码 片段 : 


; 8 位 安全 测试 版 本 1 
SUB AX，100h ; 从 AX 中 减 去 28 
JAE TOOBIG ; 无 符号 比较 


; 如 果 程序 到 这 里 ， 说 明 数 据 能 装 和 人 8 位 寄存 器 
IJMP OUTSIDE 


TOOBIG: 
; 如 果 程 序 到 这 里 ， 说 明 AX 中 的 数据 超过 8 位 
OUTSIDE: 


; 继续 做 所 需要 的 工作 
这 个 代码 段 的 一 个 问题 是 ， 为 了 正确 设置 标志 ，AX 的 值 必 须 被 修改 。 一 个 可 能 的 解决 方 
法 是 要 保存 AX 的 值 (MOV 该 值 到 存储 单元 ) 并 且 在 设置 标志 之 后 再 取 回 该 值 。 这 是 可 行 的 ， 
MOV 指 令 不 影响 标志 寄存 器 ， 能 保持 先前 的 设置 。 因 此 ， 我 们 可 以 重 写 8 位 安全 测试 ， 该 测 
试 稍微 多 用 些 空间 和 时 间 ， 代 码 如 下 : 


; 8 位 安全 测试 版 本 2 
MOV SOMEWHERE, AX ， 将 AX 存 人 SOMEWHERE 
SUB AX，100h ， 从 AMX 中 减 去 28 
MOV AX, SOMEWHERE ， 恢复 人 在 公 ， 不 影响 标志 位 
JAE TOOBI 1 无 符号 
， 如果 程 序 到 这 里 ， 说 明 数 据 能 装 入 8 位 寄存 器 
JMP OUTSIDE 
TOOBIG: 
+ 如 果 程 序 到 这 里 ， 说 明 AX 中 的 数据 太 大 
OUTSIDE: 
;继续 做 所 需要 的 工作 


Intel 指 令 集 用 一 个 专用 命令 提供 了 一 种 更 好 的 方法 。 具 体 地 ， 助 记 符 CMP 执 行 非 破坏 性 
减法 。 这 条 指令 计算 第 一 个 数 减 去 第 二 个 数 的 结果 (如 上 述 例 中 所 做 ) ， 并 据 此 设置 标志 寄存 
器 ， 但 是 不 在 任何 位 置 保存 减法 的 结果 。 因 此 ， 重新 将 第 一 个 版 本 改写 如 下 : 


; 8 位 安全 测试 版 本 3 

CMP AX, 100n ;比较 25 与 AX 

JAE TooO| ;无 符号 比较 
如果 和 到 过 电 ， 说 明 数据 能 装 入 8 位 寄存 器 

JMP OUTSIDE 


TOOBIG: 
; 如 果 程 序 到 这 里 ， 说 明 AX 中 的 数据 太 大 

OUTSIDE: 

; 继续 做 所 需要 的 工作 


该 代码 保持 了 第 一 版 本 的 效率 而 又 未 破坏 寄存 器 中 的 值 。 
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除了 这 些 相当 传统 的 比较 和 转移 指令 之 外 ，Intel 提 供 了 一 些 专用 指令 (有些 重复 ,不 是 
吗 ? ) 支持 有 效 的 循环 。CX 寄 存 器 协调 这 一 目的 。 具 体 地 ， 借 助 JCXZ 指 令 ， 如 果 CX 的 值 是 0 
计算 机 就 跳 转 。 借 助 该 指 令 ， 可 以 建立 计数 器 控制 的 循环 


MOV Cx, 100 ， 循 环 100 次 
BEGIN: 
; 做 些 有 趣 的 事情 
DEC CX ; 计数 器 减 1 
]JCXZ LOOPEXIT ; 如 果 完 成 (CX=0) 则 退出 
]MP BEGIN ， 返 回 开始 处 
LOOPEXIT: 
; 现在 在 循环 之 外 


甚至 更 简洁 地 ，LOOP 指 令 处 理 递 减 和 转移 一 它 将 递减 循环 计数 器 并 且 如 果 计数 器 未 达 
到 0 时 转向 目标 标号 。 因 此 ， 我 们 能 将 上 面 的 循环 简化 为 一 条 有 趣 的 语句 ，: 


MOV CX，100 ; 循环 100 次 
BEGIN: 

;做 些 有 趣 的 事情 ， 当 CX=0 时 退出 

LOOP BEGIN ， 返 回 开 始 处 

; 现在 在 循环 之 外 


使 用 浮 点 比较 结果 就 难以 处 理 了 。 基 本 问题 在 于 标志 寄存 器 位 于 主 CPU (具体 在 控制 单 
元 ) 内 ，CPU 通 过 控制 单元 中 的 PC 处 理 转 移 指令 。 与 此 同时 ， 所 有 的 浮 点 数 都 存放 在 FPU ， 
FPU 是 与 CPU 完全 独立 的 芯片 。 数据 必须 从 FPU 移 入 标志 寄存 器 , 这 可 通过 一 组 特殊 指令 完成 ， 
这 已 经 超出 了 讨论 的 范围 。 


裤 充 资料 
好 的 。 如 果 你 坚持 还 可 以 继续 讨论 。FPU 提 供 FCOM 指 令 和 FTST 指 令 ，FCOM 比 较 栈 
顶 的 两 个 元 素 ， 而 FTST 将 栈 顶 元 素 与 0 相 比 。 这 个 比较 结果 保存 在 “状态 字 ” 中 ， 等 价 于 
标志 寄存 器 。 要 使 用 这 个 信息 ， 数 据 要 移动 ， 首 先 移入 存储 内 (因为 FPU 不 能 直接 访问 
CPU 寄存 器 ) ， 然 后 再 移入 寄存 器 〈 因 为 标志 寄存 器 不 能 直接 访问 存储 器 ) ， 最 后 送 到 最 终 


目标 。 完 成 第 一 步 的 指令 是 FSTSW (保存 状态 字 ， 将 存储 位 置 作为 它 的 唯一 参量 ) ， 第 
二 步 用 普通 的 MOV 将 状态 字 移入 AX 足 已 ， 第 三 步 使 用 专门 的 SAHE (将 AH 存 到 标志 寄存 
器 ) 指令 。 一 般 的 无 符号 条 件 跳 转 就 可 以 正确 工作 了 。 这 一 过 程 的 复杂 性 解释 并 阐明 了 纺 
写 计算 机 程序 时 使 用 整 型 变量 速度 快 的 部 分 原因 。 





6.3.5 ”高 级 操作 

8088 提 供 了 很 多 操作 ， 我 们 只 能 涉及 其 中 的 一 部 分 。 它 们 中 的 许多 ， 也 许 是 大 多 数 ， 是 
执行 常见 任务 的 捷径 ， 比 起 使 用 简单 指令 只 需 用 较 少 的 机 器 指令 。XCHG (交换 ) 指令 就 是 
一 个 实例 ， 它 将 源 和 目标 参量 的 内 容 交换 。 另 一 个 示例 是 XLAT 指 令 ， 它 使 用 BX 寄 存 器 作为 
表 索 引 并 且 利用 表 中 保存 的 量 调整 AL 中 的 值 。 本 质 上 ，XLAT 是 操作 AL=[[ALI+BX] 的 简写 ， 
它 通 过 几 个 步骤 执行 先前 描述 的 一 些 基本 操作 。( 如 果 你 需要 将 一 个 字符 串 快 速 转换 为 大 写 表 
示 ， 这 将 会 很 有 用 ) 。 

8088 也 支持 对 于 字符 串 和 数组 类 型 的 操作 ， 为 此 要 使 用 (另外 一 组 ) 专用 指令 。 我 们 将 在 
6.4.4 节 看 到 它们 的 一 些 使 用 ， 因 为 字符 串 和 数组 通常 被 存放 在 存储 器 中 (寄存 器 容量 不 够 大 ) 。 

就 像 我 们 将 要 看 到 的 ， 使 用 更 多 操作 的 趋势 在 系列 中 的 后 继 成 员 中 呼声 更 高 ， 于 是 指令 
集 变 得 愈 发 庞大 并 且 复杂 ， 到 了 一 种 目前 几乎 没有 程序 员 知道 Pentium4 全 部 指令 细节 的 程度 。 
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(这 正 是 编写 一 个 好 的 编译 器 既 重 要 又 有 难度 的 原因 。 编 译 器 愈 聪明 程序 员 就 可 以 愈 轧 笨 .) 
6.4 ”存储 器 组 织 和 使 用 


6.4.1 ”地址 和 变量 

8088 存 储 器 的 段 组 织 已 经 描述 过 。 每 个 可 能 的 寄存 器 模式 代表 存储 器 中 一 个 可 能 的 字 节 
位 置 。 对 于 较 大 的 模式 (一 个 16 位 字 ， 或 者 32 位 “double”， 甚 至 是 80 位 “tbyte”， 包 含 10 个 
字 节 并 且 保 存 一 个 浮 点 值 )， 人 们 能 够 增补 两 个 或 者 多 个 相 邻 字 节 单 元 。 只 要 计算 机 能 够 计算 
出 有 多 少 个 字 节 在 使 用 ， 访 问 不 同 容量 的 存储 单元 就 非常 简单 了 。 

遗憾 的 是 ， 这 个 信息 对 于 计算 机 而 言 并 不 总 是 可 用 的 。 先 前 的 小 谎言 暗示 ， 

ADD [BX] ,1 ; 增加 BX 所 指向 的 存储 单元 内 的 值 
是 合法 的 。 可 惜 存储 在 BX 中 的 值 是 一 个 地 址 ， 因 此 没有 容易 的 方法 知道 目标 量 是 16 位 还 是 8 
位 。( 类 似 地 ， 我 们 不 知道 需要 加 0x0001 还 是 0x01。) 取决 于 目标 的 容量 ， 这 个 语句 可 以 被 解 
释 /汇编 为 任何 3 种 不 同 机 器 指令 之 一 。 汇 编 器 (和 我 们 ) 需要 一 个 提示 以 便 知 道 如 何 解 释 
[BX]。 这 也 同样 适用 于 直接 使 用 一 个 具体 的 存储 地 址 的 情况 ， 如 下 : 

ADD [4000h] ，1 ; 增加 0x4000 存 储 单元 内 的 值 

有 两 种 方法 给 计算 机 一 个 这 样 的 提示 。 简 单 点 但 是 不 很 有 用 的 方法 是 在 语句 中 确切 解释 
其 含义 ，4000h 应 该 被 解释 为 指向 一 个 16 位 的 字 地 址 ， 该 行 重 写 成 : 

ADD ”WORD PTR [4600h] ，1  ， 增加 0x4000 存 储 单元 内 的 值 
与 其 相对 比 ， 使 用 BYTE PTR 将 4000h 强 迫 解释 成 1 个 8 位 地 址 ， 使 用 DWORD PTR ( 双 字 ) 将 
4000h 强 迫 解释 成 1 个 32 位 地 址 。 

一 个 更 加 通用 的 解决 方法 是 提前 通知 汇编 器 ， 告 诉 汇编 器 要 用 一 个 特殊 的 存储 单元 以 及 
希望 使 用 的 容量 。 这 样 一 来 ， 这 个 存储 单元 的 名 字 可 以 像 直接 方式 寻 址 那样 被 用 作 该 存储 位 
置 内 容 的 简略 表示 。 这 与 高 级 语言 如 Java，C++ 或 者 Pascal 声 明 变 量 的 作用 相似 。 取 决 于 8088 
汇编 语言 的 版 本 和 生产 者 ， 下 面 的 每 一 条 都 可 行 ， 定 义 了 16 位 变量 (名 字 和 由 程序 员 选 择 ) : 


examplel WORD ”1000 ; 1000 

example2 DW 2000h ; 2000h == 0x2000 

现在 这 些 值 能 以 直接 寻 址 方式 随意 使 用 : 

MOV AX, examplel ; AX 现 在 是 1000 

ADD example2, 16 3 examp1e2 现 在 是 2010h 
CMP AX，examp1e2 ; AX 大 于 examp1e2 吗 ? ( 否 ) 


这 个 声明 用 于 几 个 目的 。 首 先 ， 计 算 机 现在 知道 两 个 16 位 存储 单元 已 经 被 保留 用 于 程序 
中 的 数据 。 其 次 ， 程 序 员 已 经 解除 了 准确 记 住 这 些 存储 单元 的 负担 ， 因 为 程序 员 可 通过 有 含 
义 的 名 字 引 用 它们 。 最 后 ， 汇 编 器 已 经 知道 它们 的 容量 并 且 在 编写 机 器 代码 时 知道 如 何 使 用 
这 些 存 储 单元 。 这 并 不 是 说 程序 员 不 能 超越 汇编 器 


exple3 WORD 1234h ;定义 16 位 空间 
ADD ”BYTE PTR exple3，1 ”， 合法 但 是 思春 


但 是 这 很 有 可 能 导致 程序 出 现 故障 。( 相 比 之 下 ， 如 果 你 试图 访问 所 存储 的 数据 元 素 的 某 
个 部 分 ，JVM 就 变 得 非常 恼火 并 且 通 常 不 允许 你 这 样 做 。) 

汇编 器 将 会 接受 多 种 类 型 的 存储 器 预 留 ， 包 括 一 些 很 大 的 类 型 以 至 于 不 能 在 寄存 器 中 轻 
松 处 理 。 使 用 更 加 现代 的 语法 ， 下 列 任 一 声明 都 是 合法 的 定义 ; 


Tiny BYTE 12h ; 单一 字 节 
Sma11 WORD 1234h ; 两 个 字 节 
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Medium DWORD 12345678h ; 四 个 字 节 
Big QWORD 1234567812345678h 
字 节 


Huge TBYTE 12345678901234567890h 
， 十 个 字 节 
; 《用 于 FPU) 
浮 点 常数 可 以 用 REAL4 (对 于 32 位 数 )、REAL8 (对 于 64 位 数 ) 或 REAL10 (对 于 80 位 数 ) 
定义 。 数 值 本 身 通常 以 正常 或 者 指数 形式 表示 : 
Sqrt2 REAL4 1.4143135 ; 实数 
Avogad REAL8 6.023E+23 ， 指 数 表示 
通过 用 ? 作为 初 值 ， 可 以 定义 存储 单元 而 不 必 初 始 化 。 当 然 ， 在 这 种 情况 下 存储 器 仍 将 
包含 茶 种 模式 ， 但 是 无 法 预料 其 中 的 内 容 ， 如 果 你 试图 使 用 那个 值 可 能 会 发 生 错 误 。 


6.4.2 ” 字 节 交换 

存储 器 中 的 内 容 如 何 与 寄存 器 中 的 内 容 进行 比较 ? 具体 地 ， 如 果 16 位 模式 0100 1001 1000 
0101 保 存在 AX 寄 存 器 中 ， 它 与 保存 在 存储 器 中 同样 的 16 位 模式 的 值 相同 吗 ? 

出 乎 意料 地 ， 答 案 是 “不 相同 ”( 也 许 它 并 不 是 那么 让 人 意外 ， 如 果真 的 那么 简单 ， 这 本 
书 的 这 一 节 就 不 会 存在 了 )。 再 者 ， 作 为 一 个 古老 机 器 的 产物 ，8088 具 有 相当 奇特 的 存储 模式 。 

人 们 写 数 时 通常 使 用 所 谓 的 大 端 (big-endian) 表示 。 所 谓 的 最 高 有 效 数 (对 应 最 高 次 方 
的 数 ) 先 写 ( 和 人 先 存 )， 而 小 一 些 的 较 低 有 效 数 跟 在 后 面 。 快 速 检 查 说 明 ; 通常 在 纸 上 写 数 时 
按 大 端 格式 ， 首 先 写 出 的 数字 意味 着 基数 的 最 高 次 方 。 类 似 地 8088 CPU 在 寄存 器 中 按 大 端 排 
序 存储 数值 。 如 上 和 写 出 的 值 (0x4985) 将 代表 十 进 制 值 18821。 然 而 ， 存 储 器 中 的 数据 实际 上 
按 小 端 格式 逐个 字 节 保存 。 具 有 较 小 地 址 (0x49,0100 1001) 的 字 节 是 最 低 有 效 字 节 ， 另 一 个 
字 节 是 最 高 有 效 字 节 。 (威廉 姆 小 姐 ， 我 七 年 级 的 英语 老师 ， 坚 持 认为 只 有 两 个 字 节 时 不 能 说 
“最 高 ”有 效 字 节 ， 只 能 用 “ 较 高 ”有 效 字 节 。 但 这 种 场合 下 专业 术语 会 战胜 传统 英语 语法 。) 


因此 ， 在 存储 器 中 这 一 模式 将 表示 0x8448 ， 几 乎 
册 代 大 。 这 一 模式 也 适应 更 大 的 数 ， 于 是 32 位 的 | oo | 5 | oot | oz | 


量 0x12345678 将 存储 为 4 个 独立 的 存储 器 字 节 ， 图 6-4 0x12345678 的 存储 ， 字 节 交 换 图 示 
如 图 6-4 所 示 。 

幸运 的 是 ， 程 序 员 几乎 不 必 记 住 这 一 点 。 任 何 时 候 数 据 移 人 或 者 移出 存储 器 ， 字 节 交 换 
都 在 硬件 一 级 自动 完成 。 除 非 程 序 员 明确 地 无 视 汇 编 器 关于 数据 大 小 的 认识 (如 上 节 )， 唯 独 
变 得 重要 的 时 候 就 是 处 理 多 组 数据 ， 例 如 数组 及 其 扩展 、 串 或 者 从 一 种 机 器 到 另外 一 种 机 器 
移动 数据 。( 当 然 ， 几 乎 不 并 不 等 于 决 不 ， 当 它 变 得 重要 时 ， 这 可 能 就 是 致使 你 要 用 头 撞墙 的 
某 类 错误 的 根源 。) 


6.4.3 数组 和 串 

用 于 预 留 单个 存储 单元 的 表示 也 能 用 来 预 留 大 的 、 多 单元 的 存储 块 。 可 以 通过 用 逗号 分 
隔 的 值 列表 或 者 简写 DUP 代 表 的 重复 值 来 设置 存储 值 。 例 如 ， 

Greet BYTE 48h,45h,4Ch,4Ch,4Fh ，ASCII "HELLO" 

Thing DWORD 5 DUP 68x12345678  ，5 个 相同 的 值 

Empty WORD 10 DUP (?) ; 10 个 空位 置 
分 别 定 义 了 5 个 字 节 的 字母 (了 BE,， 工 ，L 和 0O) 数组 6reet ， 一 组 双 字 Thing， 以 及 具有 10 个 2 
字 节 数值 的 数组 Empty， 每 个 值 均 未 初始 化 。 

要 访问 这 些 数 组 元 素 ， 程 序 员 需要 从 数组 基地 址 开始 索引 或 者 偏 移 。 如 果 Greet 中 的 H 被 
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存储 在 3000h， 那 么 E 将 被 存储 在 3001h ，3002h 处 是 第 一 个 L，O 存 储 在 3004h。 当 然 ， 我 们 不 
知道 Greet 究 竟 被 存储 在 哪个 地 址 ， 但 是 无 论 它 被 放 在 哪里 ,，“H” 要 比 “E” 低 一 个 单元 的 位 
置 。 通 常 ， 数 组 名 本 身 指向 数组 开始 值 的 位 置 。 因 此 ， 要 将 前 三 个 字母 装 入 AH，BH 和 CH 
( 字 节 ) 寄存 器 ， 可 以 使 用 


MOV AH, [Greet] ; 装 入 H 
MOV BH, [Greet + 1] ; 装 入 E 
MOV CH, [Greet + 2] ; 装 入 L 


(至 少 ， 对 于 本 书 ) 这 实际 上 是 一 个 新 的 寻 址 方式 ， 称 为 索引 方式 。 如 前 ，[X] 表 示 “ 存 
储 器 和 单元 的 内 容 ”， 但 是 在 此 例 中 ，X 是 一 个 相当 复杂 的 值 ， 计 算 机 需要 实时 地 计算 此 值 。 
由 直觉 可 得 [Greet] 与 [Greet+0] 以 及 Greet 自 身 相 同 ，[Greet+1] 是 邻接 的 字 节 。 由 于 计算 机 知道 
Greet 包 含 字 节 (由 存储 器 预 留 声明 所 定义 )， 它 假定 [Greet+1] 也 是 一 个 字 节 。 

我 们 怎样 访问 Empty 数 组 元 素 ? 第 一 个 元 素 就 是 [Empty]， 或 者 [Empty+0]， 或 者 就 是 
Empty 本 身 。 不 过 在 这 种 情况 下 ， 由 于 Empty 包含 的 是 WORD 对 象 ， 所 以 下 一 个 字 就 不 是 
[Empty+l] 而 是 [Empty+2]! 与 大 多 数 高 级 语言 不 同 ， 索 引 的 计算 自动 地 考虑 了 元 素 的 类 型 ， 
8088 索 引 方式 寻 址 需要 程序 员 处 理 元 素 空间 大 小 的 问题 。 

索引 方式 寻 址 涉及 寄存 器 更 广泛 的 用 途 。 在 高 级 语言 中 ， 例 如 ， 最 常见 的 数组 操作 就 是 
使 用 变量 索引 一 一 如 ， 访 问 循环 内 的 元 素 a[i， 乾 一 个 整 型 变量 。 等 价 的 汇编 语言 利用 一 个 通 
用 寄存 器 作为 索引 表达 式 的 一 部 分 。 表 达 式 [Greet+BX] 将 访问 数组 Greet 的 第 BX 个 元 素 (如 果 
这 个 字 有 意义 ) 。 通 过 调整 BX 中 的 值 (假设 从 0 到 4)， 表 达 式 [Greet+BX] 将 依次 选择 每 一 个 元 
素 。 类 似 地 ， 按 每 次 加 2 调整 BX 中 的 值 ， 即 按 字 的 空间 大 小 ， 我 们 可 以 用 下 述 程 序 段 将 整个 


Empty 数 组 初始 化 为 0: 
MOV CX, 10 ; Empty 中 有 10 个 元 素 
MOV BxX, 8 ; 从 [Empty+0] 开 始 
BEGIN: 
MOV [Empty+BX] ，@ ; 将 这 个 元 素 置 0 
ADD BX，2 4 移 向 下 一 个 字 
LOOP BEGIN ， 循 环 ， 直 到 CX=0 退 出 循环 


只 有 几 个 16 位 寄存 器 能 够 合法 地 用 作 这 类 表达 式 中 的 索引 ，8 位 寄存 器 都 是 不 合法 的 。 只 有 
BX、BP、SI 和 DI 寄 存 器 能 够 使 用 ， 而 且 ，BP 寄 存 器 还 不 能 用 于 该 用 途 ， 因 为 这 样 可 能 会 出 
错 。BP 寄 存 器 已 经 被 操作 系统 留用 ， 稍 后 将 在 6.4.7 节 讨论 。 

有 经 验 的 C 和 C++ 程序 员 也 许 已 经 急于 找寻 一 种 快速 并 且 有 效 的 方式 了 。 不 用 每 次 经 过 循 
环 时 去 计算 [Empty+BX]， 为 什么 不 将 BX 本 身 设 置 为 [Empty+0] 所 在 的 位 置 呢 ? 依 此 建议 得 到 
的 代码 如 下 : 


; 警告 ， 这 行 不 通 ! 
MOV CX，10 ; Empty 中 有 10 个 元 素 
MOV BX, Empty ， 从 [Empty+0] 开 始 (错误 ! ) 
BEGIN: 
MOV [BX], 6 ; 将 这 个 元 素 置 0 
ADD  BX，2 ; 移 向 下 一 个 字 
LOOP ”BECIN ， 循 环 ， 直 到 CX=0 退 出 循环 


尽管 这 是 个 好 主意 ， 但 执行 起 来 就 不 是 那么 回 事 了 ， 主 要 因为 MOV BX，Empty 并 没有 按 
我 们 希望 的 去 做 。 汇 编 器 将 Empty 视 为 直接 方式 寻 址 的 简单 字 节 变量 ， 并 且 试 图 将 Empty 的 首 
字 节 (“H”) 移 人 BX。 这 不 是 我 们 想 要 的 。 事 实 上 ， 它 甚至 还 不 合法 ， 因 为 我 们 试图 将 一 个 
单字 节 移 入 一 个 四 字 节 的 寄存 器 中 ， 这 会 导致 空间 大 小 的 冲突 。 要 明确 地 使 用 一 个 指针 型 变 
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量 ， 我 们 借助 关键 字 OF ”SBT 产生 存储 器 地 址 而 不 是 其 内 容 。 


x, ; Empty 中 有 10 个 元 素 
BECIN: MOV BX， OEFSET Empty ， 从 [Empty+0] 开 始 
MOV [BX] ，6 ， 将 这 个 元 素 置 0 
ADD BX，2 ， 移 向 下 一 个 字 
LOOP BEGIN 


; 循环 ， 直 到 CX=0 退 出 循环 
当然 ， 所 得 的 实际 时 间 / 空 间 改进 可 能 是 有 限 的 ， 因 为 用 于 索引 的 加 法 仍然 由 一 条 单独 的 
8088 机 器 指令 完成 。 然 而 ， 特 别 是 在 紧 竣 的 且 经 常 执行 的 小 循环 中 ， 每 个 小 的 改进 都 是 有 益 的 。 


6.4.4 串 原 语 

如 同 前 面 的 Greet 示 例 ， 串 可 以 用 字符 数组 实现 〈 通 常 作为 字 节 ， 有 时 也 会 更 大 些 ) 。 
8088 也 提供 一 些 串 原 语 操作 指令 ， 这 些 指令 易于 快速 地 执行 常用 的 串 功能 。 这 些 基 本 操作 都 
要 使 用 SI， DI 或 者 两 者 同时 使 用 一 SI 和 DI 专门 用 于 优化 这 些 操作 

现在 ， 我 们 就 集中 关注 从 一 个 位 置 到 另 -个 位 置 的 复制 或 移动 这 样 的 简单 任务 。 依据 串 
元 素 的 基本 大 小 ， 有 两 个 基本 的 操作 : MOVSB (移动 字 节 趾 ) 和 MOVSW (移动 字 捉 )。 这 
种 基于 串 元 素 基本 大 小 的 划分 适 于 所 有 串 原 语 操作 指令 ， 这 里 还 有 两 点 不 同 就 是 分 别 以 B 和 WW 
结尾 。 因 此 ， 为 了 简化 解释 ， 我 们 将 相似 的 操作 行为 归结 为 MOVS? 名 下 。 

MOVS? 操作 将 数据 从 [SN] 复制 到 [DD]。 这 个 操作 本 身 只 复制 单独 一 个 元 素 ， 但 是 很 容易 
将 其 放 到 一 个 简单 的 循环 体内 。 串 原 语 操作 的 优点 是 CPU 在 机 器 指令 中 支持 自动 循环 ， 在 汇 
编 语言 级 用 一 个 前 缀 助 记 符 来 表达 。 最 简单 的 例子 就 是 用 REP 前 缀 ， 例 如 

REP MOVSB 

这 一 行为 很 像 LOOP? 指令 ， 在 此 CX 寄 存 器 被 当 作 计 数 器 。 每 次 指令 执行 时 ，SI 和 DI 的 
值 都 要 调整 ，CX 的 值 递减 ， 指 令 反 复 地 执行 直到 CX 降 为 0。 

有 两 种 调整 SI 和 DI 的 方式 。 首 先 ， 自 动 更 新 的 幅度 与 MOVS? 指令 中 所 指 元 素 的 大 小 相 
对 应 ，SVUDI 的 改变 幅度 对 于 字 节 指令 是 1， 而 对 于 字 指 令 是 2。 其 次 ， 标 志 寄 存 器 中 的 一 个 特 
殊 标志 (方向 标志 ) 控制 地 址 从 低 到 高 ( 增 大 SIDI) 或 者 从 高 到 低 ( 减 小 SVUDI)。 这 个 标志 
有 两 条 指令 控制 ， 如 表 6-2 所 示 。 


表 6-2 基本 串 的 方向 标志 操作 


指令 标志 状态 SIDI 操 作 地 址 序列 
CLD 清 零 (=0) 加 低 到 高 
STD 置 1 (=1) 减 高 到 低 


要 明白 这 是 如 何 工作 的 ， 我 们 来 设置 两 个 数组 ， 并 在 它们 之 间 进 行 复制 。 
Arrl WORD ” ”180 DUP (-1) ， 源 数组 :100 个 字 


Arr2 WORD 100 DUP (7?) ;目的 数组 ， 也 是 100 个 字 
MOV SI, OFFSET Arr1l ; 设置 源 地 址 
MOV DI, OFFSET Arr2 ; 设置 目的 地 址 
CLD ; 清 零 方向 标志 

; 从 Arr1[0] 到 Arr1[99] 
MOV CX，100 :循环 处 理 99 个 字 
REP MOVSW ; 进行 拷贝 


另外 一 个 常见 的 操作 就 是 比较 两 个 串 是 否 相 等 。 这 可 用 CMPS? 操作 完成 ， 该 操作 隐 含 执 
行 从 源 操作 数 减 去 目的 操作 数 。 重 要 的 安全 提示 : 该 操作 是 CMP 指 令 的 相反 过 程 CMP 是 从 
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目的 减 去 源 ! 更 重要 地 ， 该 指令 通过 设置 标志 位 使 得 正常 的 无 符号 条 件 跳 转 将 完成 应 该 做 的 
事情 。 

REP 前 缀 的 另 一 个 变形 在 这 样 的 背景 下 特别 有 用 。 只 要 CX 不 为 0 并 且 零 标志 被 置 位 REPZ 
(或 者 REPE) 就 循环 执行 。 这 实际 上 意味 着 “还 没有 到 达 串 的 结尾 并 且 到 目前 为 止 两 个 串 是 
相同 的 ” ， 因 为 零 标志 仅 当 减法 的 结果 是 0 时 才 置 位 ， 这 意味 着 这 两 个 字符 是 相同 的 。 利 用 下 
面 的 代码 段 我 们 能 够 进行 串 的 比较 ; 

MOV SI，OFFSET Astring  ， 设置 源 地 址 

MOV DI，OFFSET Bstring  ”; 设置 自 的 地 址 


CLD ; 清 零 方向 标志 
MOV CX，100 ; 循环 100 次 
REPE CMPSW ; 比较 


这 段 代 码 执行 后 会 有 两 种 可 能 发 生 。 一 种 可 能 是 : CX 变 为 0 且 Z 标 志 置 位 ， 这 种 情况 下 两 
个 字 串 相同 。 因 此 ， 语 名 

JE STRINGSEQUAL ; 串 相 等 
能 转移 到 相应 的 代码 段 。 

另 一 种 可 能 是 ， 两 个 元 素 比 较 时 Z 标 志清 零 ， 说 明 两 个 元 素 不 相同 。 差 值 的 详细 结果 (SI 
中 的 字 节 比 DI 中 的 大 还 是 小 ) 保存 在 标志 寄存 器 中 ， 如 同 CMP 操 作 的 结果 。 通 过 用 JB ，JA， 
JAE 等 检查 其 他 的 标志 ,我们 能 够 判断 出 究竟 是 源 (SI) 还 是 目的 (DI) 寄存 器 指向 较 小 的 串 。 
主要 的 困难 在 于 留 在 SI 和 DI 寄存 器 的 地 址 指向 了 错误 的 位 置 。 具 体 地 说 ，SI (DI) 中 的 值 已 
经 越过 了 比较 的 串 位 置 一 或 者 说 刚好 在 串 结 尾 的 下 一 个 位 置 。 

]B SOURCESMALLER ; SI 指向 的 串 小 

; 如 果 到 达 此 处 ，DI<SI 

第 三 个 有 用 的 操作 是 从 一 个 串 中 寻找 某 个 值 的 出 现 (或 者 不 出 现 )。( 例 如 ， 一 个 包含 浮 
点 数 的 串 将 会 有 “. ”字符 ， 否则， 将 是 一 个 整数 。) 这 由 SACS? 〈SCAn 串 ) 指令 实现 。 不 
同 于 先前 的 指令 ， 这 类 指令 只 处 理 一 个 串 ， 因 此 用 一 个 索引 寄存 器 (DI)。 该 指令 将 累加 器 
(AL 或 AX， 取 决 于 数据 的 大 小 ) 中 的 值 与 串 的 每 个 元 素 进行 比较 ， 设 置 标志 并 且 适 时 地 更 新 
DI。 同 样 ， 如 果 使 用 REP? 就 会 在 CX 为 0 到 达 串 的 结尾 或 者 Z 标 志 变 为 正确 的 值 时 停 上 下， 无 论 
哪 种 情况 最 后 的 DI 都 是 指向 所 感 兴趣 位 置 的 邻近 下 一 个 位 置 。 

使 用 REPZ 前 级 ， 我 们 能 够 跳 过 一 个 串 开 头 和 结尾 处 的 空格 。 假 设 Astring 包 含 一 个 100 字 
节 的 数组 ， 其 中 一 些 (在 开头 或 结尾 ) 是 空格 字符 (ASCII 值 是 32)。 要 找 出 第 一 个 非 空 字符 
所 在 的 位 置 ， 我 们 可 以 使 用 下 面 的 代码 段 ， 


MOV DI,Astring ，; 载 入 串 

MOV AL，32 ;向 累加 器 载 和 空格 字 节 

MOV CX, 160 ; Astring 串 中 有 100 个 字符 

CLD ; 清 零 方向 标志 

REPE SCASB ; 扫描 不 匹配 

JE ALLBLANKS ; 如 果 7 标 志 置 位 ， 没 有 发 现 不 匹配 
， 否则 ，DI 指 向 了 第 一 个 非 空格 字符 后 的 一 个 字 节 

DEC DI ; 恢复 0DI， 指 向 第 一 个 非 空格 字符 


要 跳 过 尾部 的 空格 ， 我 们 只 要 从 末尾 开始 〈 即 Astring+99) 并 设置 方向 标志 以 便 从 右 向 左 
进行 串 的 操作 : 


MOV DI,Astring ; 载 入 串 

ADD DI，99 + 跳 至 串 尾 

MOV AL，32 ;向 累加 器 载 人 空格 

MOV CX，100 ; Astring 捉 中 有 100 个 字符 


STD ; 方向 标志 置 1 
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REPE SCASB ; 扫描 不 匹配 
JE ALLBLANKS ; 如 果 Z 标 志 置 位 ， 没 有 发 现 不 匹配 
Lh DI 乔 向 了 第 一 个 疾 空格 字符 后 的 一 个 让 

; 恢复 DI， 指 向 第 一 个 非 空格 字符 


类 似 的 前 级 ，REPNZ (或 REPNE ) ， 只 要 2 标志 未 置 位 ， 也 就 是 说 只 要 元 素 不 相同 ， 指 令 
就 会 反复 执行 。 因 此 ， 要 在 串 中 找 出 第 一 个 “.” (ASCI 值 44) ， 我 们 对 第 一 段 程序 略 做 修改 ; 


MOV DI,Astring ; 载 人 串 

MOV AL，44 ; 向 累加 器 载 入 字 节 “ 

MOV CX，100 ; 00 个 字符 

CLD ， 请 零 方向 标志 

REPNE SCASB ; 扫描 匹配 

JNE NOPERIOD ; 如 果 Zz 标 志清 零 ， 没 有 发 现 匹配 
# 否则 ，DI 指 向 了 第 一 个 “. ” 字符 后 的 一 个 字 节 

DEC DI ; 恢复 DI， 指 向 第 一 个 “. ”字符 


最 后 一 个 常用 的 串 原 语 就 是 将 某 个 值 反复 地 复制 到 一 个 串 。 例 如 ， 这 可 用 于 数组 快速 清 
零 。STOS ( 存 人 串 ) 将 累加 器 的 值 复制 到 指定 串 。 要 将 先前 定义 的 空白 数组 存 和 全 0， 可 以 
使 用 以 下 代码 ; 


MOV DI, Empty + 目标 
MOV CX，10 ; 要 存储 10 个 元 素 


MY Ne ， 要 存 人 的 值 是 0 


遗憾 的 是 ， 这 是 8088 对 用 户 定义 派生 类 型 的 唯一 支持 。 例 如 ， 如 果 程 序 员 想 用 多 维 数组 ， 
程序 员 就 必须 自己 想 好 如 何 规划 存储 布局 。 类 似 地 ， 一 个 结构 或 者 记录 只 能 用 邻近 存储 单元 
表示 ， 对 于 面向 对 象 的 编程 没有 提供 支持 。 这 必须 通过 高 层 的 汇编 器 和 /或 编译 器 解决 。 


6.4.5 ”局 部 变量 和 信息 隐藏 

目前 所 定义 的 存储 器 组 织 有 一 个 问题 就 是 每 个 存储 单元 都 隐 含 地 定义 用 于 整个 计算 机 。 
采用 高 级 语言 编程 常用 的 术语 来 讲 ， 就 是 我 们 看 到 的 每 一 个 变量 都 是 全 局 的 一 一 意味 着 能 从 
程序 中 任何 地 方 去 访问 或 者 修改 (先前 定义 的 ) Greet 数 组 。 这 也 意味 着 整个 程序 只 能 有 一 个 
变量 命名 为 Greet。 比 较 好 的 编程 习惯 提倡 使 用 局 部 变量 ， 它 具有 私密 、 安 全 以 及 重用 名 称 的 
能 力 。 类 似 地 ， 正 如 JVM 中 讨论 的 ， 只 有 跳 转 指令 限制 了 程序 员 重 用 代码 的 能 力 。 


6.4.6 ”系统 栈 

JVM 和 8088 两 者 都 支持 子 例 程 〈 子 程序 ) 。 如 同 JVM 的 jsr 指 令 ，8088 提 供 CALL 指 令 与 
硬件 栈 配 合 。 该 指令 将 程序 指针 (IP) 的 当前 值 压 入 栈 并 且 从 转移 参数 所 指 的 位 置 开 始 执行 。 
对 应 的 RET 指 令 弹 出 栈 顶 值 ， 将 其 装 入 指令 指针 ， 从 保存 的 位 置 继续 执行 。 

8088 认 定 标准 的 PUSH 和 POP 指 令 从 机 器 栈 移入 /移出 数据 。 例 如 ， 良 好 的 编程 习惯 提倡 不 
要 破坏 子 程序 中 寄存 器 的 内 容 ， 因 为 无 法 确定 调用 环境 不 再 需要 该 数据 。 确 保 这 不 会 发 生 的 
最 简 方 式 就 是 在 子 程序 开始 处 保存 (PUSH) 这 些 寄存 器 并 在 结束 的 时 候 恢 复 (POP) 它们 。 
PUSH 和 POP 指 令 均 接受 寄存 器 或 存储 器 地 址 参数 ，PUSH AX 和 PUSH SomeLocn 都 是 合法 的 。 
要 压 入 一 个 常数 值 ， 应 该 首先 将 其 载 人 存储 器 或 者 寄存 器 一 当然 ， 栈 内 容 弹 出 到 一 个 常数 中 
就 没有 意义 了 。 

多 数 汇 编 器 不 鼓励 子 程序 调用 和 跳 转 语句 使 用 同一 个 标签 ， 尽 管 CPU 并 不 关心 这 一 点 。 
(毕竟 这些 标签 只 是 加 到 程序 计数 器 中 的 数值 ! ) 然而 ， 如 果 对 此 没有 认真 处 理 ， 程序 员 将 
会 违反 栈 规则 ， 要 么 将 多 余 的 东西 留 在 栈 中 (导致 栈 充 满 进 而 产生 溢出 错误 )， 要 么 从 一 个 空 
栈 中 弹出 并 使 用 垃圾 内 容 。 也 就 是 说 ， 不 要 这 样 去 做 。 由 于 这 一 原因 ，8088 汇 编 语言 中 的 子 
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程序 与 我 们 已 经 见 过 的 标签 有 些 不 同 : 
MyProc PROC 


PUSH CX ; 将 CX 压 入 栈 中 保存 
; 聪明 地 做 些 事情 
MOV CX，10 
MyLabe1 : 
; 在 10 次 循环 内 做 些 聪 明 的 事情 
LOOP MyLabel] 
POP CX ; 恢复 CX 


RET 

MyProc ENDP 

这 里 有 几 点 需要 注意 。 首 先 ， 为 了 帮助 程序 员 和 汇编 器 跟踪 差异 ， 标 签 MyProc 的 声明 有 
别 于 标签 MyLabel (例如 ， 没 有 冒号 ) 。 第 二 ， 例 程 用 PROC/ENDP 开 头 和 结尾 。 这 些 不 是 助 
记 符 ， 只 是 汇编 制导 ， 它 们 并 不 会 翻译 为 机 器 指令 。 它 们 只 是 帮助 程序 员 和 汇编 器 组 织 程序 。 
最 后 一 条 机 器 指令 是 RET， 这 是 子 程序 需要 的 。 第 三 ，CX 寄 存 器 用 于 子 程序 内 部 循环 的 索引 ， 
因为 值 被 压 入 栈 顶 并 且 在 子 程序 结尾 处 弹出 ， 所 以 调用 环境 看 不 到 CX 中 的 任何 变化 。 从 其 他 
例 程 调用 这 个 例 程 是 合法 的 ， 调 用 如 下 : 


Other PROC 


MOV CX, 50 ; 调用 MyProc 50 次 
LoopTop: 

CALL MyProc ; 执行 MyProc 子 例 程 

LOOP LoopTop ， 在 循环 中 (50 次 ) 


Other ENDP 


Other 过 程 使 用 同样 的 循环 结构 ， 包 括 CX， 调 用 MyProc 50 次 ， 但 是 由 于 CX 寄存 器 被 保护 
了 ， 所 以 不 会 出 错误 。 当 然 ，Other 过 程 自身 使 用 CX 寄 存 器 ， 所 以 调用 Other 必须 注意 。( 更 好 
的 Other 版 本 一 专业 程序 员 期 待 的 一 会 在 使 用 前 先 利用 PUSH/POP 指 令 对 其 做 类 似 的 保护 。) 


6.4.7 栈 帧 
除了 提供 临时 存储 的 寄存 器 ， 存 储 器 中 的 栈 也 可 以 用 于 临时 存储 局 部 变量 。 要 理解 这 是 
如 何 工作 的 ， 我 们 首先 看 栈 本 身 怎样 工作 (图 6-5)。 
8088 的 一 个 通用 寄存 器 SP 保留 给 CPU 和 操作 系统 用 来 
保存 机 器 栈 顶 当前 的 位 置 。 在 任何 程序 的 开始 ，SP 的 值 被 
设置 为 靠近 主 存 顶端 的 某 个 位 置 一 主 存 相 对 高 地 址 的 部 
分 ， 而 程序 本 身 被 保存 在 较 低 的 位 置 。 在 程序 和 栈 顶 之 间 
是 大 片 的 未 用 空闲 存储 区 。 
一 旦 数据 被 放 入 栈 中 (一 般 由 PUSH 或 者 CALL) ，SP 
寄存 器 就 减 去 一 个 适当 的 量 ， 通 常 是 2。 这 将 栈 顶 又 向 程 
序 部 分 推进 了 2 个 字 节 。 压 入 的 值 就 保存 在 这 2 个 字 节 中 。 
另 一 个 PUSH 会 使 5P 再 降 2 个 字 节 并 保存 另外 的 数据 。 与 直 
觉 正 好 相反 ， 这 意味 着 栈 “ 顶 ”实际 上 是 栈 的 最 低 (最 小 ) 
地 址 部 分 。 当 数据 从 栈 弹 出 时 ，[SP] 处 的 值 被 复制 到 变量 
中 ， 然 后 SP 加 2， 设 置 为 新 的 “ 栈 顶 ”。( 这 也 适 于 执行 
RET 并 且 从 栈 中 弹出 原 有 的 程序 计数 器 内 容 。) 图 6-5 CPU 栈 (简化 ) 
然而 ， 栈 也 是 保存 局 部 变量 的 理想 位 置 ， 每 次 程序 被 
调用 ， 就 会 产生 新 的 栈 顶 。 事 实 上 ， 程 序 需要 的 任何 局 部 信息 ， 如 函数 参量 、 局 部 变量 、 保 


OxFFFFF 


Ox00000 





112 第 二 六 分 真实 计算 机 


存 的 寄存 器 内 容 以 及 数据 都 能 放 人 栈 内 。 既 然 这 是 一 个 常见 任务 ， 特别 是 在 高 级 语言 中 ， 就 
有 一 个 标准 方式 组 织 栈 以 便 不 同 复杂 程度 的 程序 能 够 
协调 运行 。 

一 基本 思想 称 为 栈 帧 (图 6-6) 。 正 如 通常 所 实 
现 的 ， 它 包含 两 个 寄存 器 ，SP 和 BP。 这 就 是 为 什么 
程序 员 不 应 该 乱用 BP 寄 存 器 进行 一 般 索 引 的 原因 ， 因 
为 BP 已 经 用 于 栈 帧 。 但 是 因为 BP 作为 索引 寄存 器 ， 

所 以 MOV AX，[BP+4] 这 类 的 表示 是 合法 的 并 且 能 用 四 现在 指向 这 里 
来 访问 靠近 BP 的 存储 单元 。 为 局 闻 误 呈 

有 了 以 上 认识 ， 栈 帧 如 下 (从 存储 器 顶部 开始 ， 保留 的 空间 
或 者 从 栈 “ 底 ”开始 ) : 

。 过 程 子 程序 的 任何 参量 

.返回 地 址 

。BP 原 有 的 值 (由 BP 指向 ) 

“保存 局 部 变量 的 空间 (由 SP 指示 顶端 ) 图 6-6 一 个 8086 栈 帧 

。 保 存 的 寄存 器 内 容 

这 是 如 何 工作 的 ? 我 们 下 面 使 用 一 个 有 些 复杂 的 例子 ; 我 想 要 编写 一 个 等 价 于 further() 
函数 或 方法 的 汇编 语言 代码 ， further( ) 采 用 了 两 个 参量 并 且 返 回 了 一 个 大 于 零 的 绝对 值 。 用 
Java 编 写 的 这 个 方法 如 图 6-7 所 示 ， 用 C/C++ 编 写 的 如 图 6-8 所 示 。 


一 [SP] 现 在 指向 这 里 





int furtherCint x, int y) 


public static int furtherCint x, int y) 


int 1,j; 

i = Xi 

if (x < 0) 
1 = 


int i,j; 


return 1i; 


return 1; 





图 6-7 Java 函 数 further(int x, int y) 图 6-8 C/C++ 函数 further(int x, int y) 


代码 本 身 很 简单 ， 假 设 我 们 将 数据 移入 AX 和 BX， 就 能 简单 地 比较 这 两 个 数 ， 如 果 BX 大 ， 
就 将 其 移入 AX。 类 似 地 ， 将 函数 的 参数 (x 和 y) 与 0 比较 ， 我 们 可 以 对 局 部 变量 使 用 NEG 指 
令 也 可 以 不 用 NEG。 然 而 ， 要 正确 地 访问 它们 ， 我 们 需要 足够 的 栈 空间 保存 这 些 局 部 变量 。 
下 面 的 代码 将 很 好 地 解决 这 个 问题 : 


Further PROC 
PUSH BP ; 保存 原 有 BP 
MOV Bp, SP ; BP 现在 指向 SP 内 容 
SUB Sp, 4 ; 留 出 两 个 16 位 局 部 变量 空间 
PUSH BX ， 保存 BX 
MOV AX, [BP+2] ; 获取 第 一 个 参量 
MOV [SP+2] ，AX 3 你 各 天 第 一 个 局 部 变量 位 置 
CMP [SP+2] ,6 ; 
JGE Skip1 5 大 是 -6 就 不 求 反 
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NEG [SP+2] ; 人 否则， 求 反 
Skip1: 
MOV AX, [BP+4] ; 获取 第 二 个 参量 
MOV [SP+4] ，AX ; 保存 在 第 二 个 局 部 变量 位 置 
CMP [SP+4], 8 ; 与 0 相 比 
JGE Skip2 ; 如 果 >=0 就 不 求 反 
， 否则， 求 反 


NEG [SP+4] 
Skip2: : 
载 人 第 一 个 局 部 变量 


MOV AX, [SP+2] 
载 人 第 二 个 局 部 变量 


MOV BX, [SP+4] 


CMP AX，BX ; 如 果 第 一 个 局 部 变量 >= 第 二 个 局 部 变量 
JGE Skip3 ; 那么 不 做 调整 
MOV BX, AX ;和 否则， 求 反 
Skip3: ; 答案 现在 AX 中 
POP BX ; 恢复 原来 BX 的 值 
ADD SPp, 4 ; 销毁 局 部 变量 
POP BP + 恢复 原来 BP 的 值 
RET ; 仍然 需要 弹出 参量 


Further ENDP 
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图 6-9 展 示 了 这 个 程序 构建 的 栈 帧 。 特 别 注意 传人 的 两 个 参量 以 及 原 有 寄存 器 值 被 保存 的 
位 置 。 最 后 ， 有 两 个 存储 器 字 与 局 部 变量 i 和 j 对 应 。 在 程序 结尾 处 栈 最 终 以 相反 的 次 序 解构 。 
为 什么 我 们 不 保存 并 恢复 AX 中 的 值 ? 因为 AX 寄 存 器 被 用 于 保持 返回 值 ， 因 此 它 的 原 有 内 容 


不 得 不 被 覆盖 。 


这 是 如 何 工作 的 ? 我 们 将 使 用 一 个 有 些 复杂 的 例子 : 我 想 编写 一 个 与 函数 further( 一 100， 
50) ( 它 将 返回 100) 等 价 的 汇编 语言 程序 。 为 了 调用 这 个 程序 ， 调 用 函数 必须 首先 将 两 个 整 
数 压 入 栈 ， 然 后 还 必须 找到 一 种 方法 在 函数 返回 后 撤销 这 两 个 值 。 完 成 这 个 任务 的 简易 方法 





如 以 下 代码 所 示 : 
x DW -100 ; 第 一 个 变量 
Y DW 50 ; 第 二 个 变量 
PUSH Xx ， 压 人 X 
PUSH YY ; 压 入 Y 
CALL FURTHER 
; 此 时 AX 包 含 值 100 
ADD Sp, 4 ; 从 栈 中 移出 X，Y 
;AX 仍然 包含 值 100 
所 构建 的 整个 栈 帧 如 图 6-9 所 示 。 
X 值 (一 100) 
Y 值 (50) 
主 调 PC 值 可 
原 有 BP 寄 存 器 值 一 [BP] 现 在 指向 这 里 
局 部 变量 1 
局 部 变量 2 
保存 的 BX 寄存 器 值 一 [SP] 现 在 指向 这 里 
图 6-9_ further(X, Y) 的 栈 帧 
6.5 再 论 锥 形 山 


作为 一 个 展现 8088 如 何 进行 算术 运算 的 有 效 示例 ， 让 我 们 来 分 析 先 前 给 出 的 山体 体积 问 
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题 。 如 第 2 章 所 述 ， 原 问题 描述 如 下 ， 

底部 呈 圆 形 、 直 径 450m、 并 且 高 150m 的 山体 体积 是 多 少 ? 

因为 答案 中 涉及 使 用 xt， 所 以 至 少 计算 部 分 应 该 在 浮 点 运算 单元 FPU 中 完成 。 我 们 假设 
(为 了 清楚 起 见 ) 名 称 /标识 符 “STORAGE” 指 示 一 个 16 位 的 存储 单元 〈 与 6.4.1 节 中 一 样 ， 这 
可 以 是 某 处 的 全 局 变量 或 者 是 栈 中 的 局 部 变量 ) ， 并 且 我 们 可 以 使 用 这 个 单元 将 数据 移 人 / 移 
出 FPU。 为 了 简单 起 见 ， 我 们 使 用 16 位 整数 以 及 寄存 器 进行 计算 。 假 设 (为 了 清楚 起 见 ) 完 
成 整 型 计算 ， 因 为 涉及 的 数 不 是 很 大 ， 这 不 会 出 现 问 题 。 

首先 ， 我们 计算 半径 ; 


MOV AX，450 + 直径 =450m 

MOV BX, 2 ; can't divide by a constant 

DIV BX ; AX=450/2，DX 仍 为 0 

底部 的 面积 是 半径 的 平方 乘 以 x， 为 了 使 用 xn， 我 们 必须 初始 化 FPU， 并 且 在 此 进行 运算 。 
; AX 中 保存 半径 

MUL AX 5 AX 平 方 ， 结 果 为 DX，AX 

FINIT ; 初始 化 FPU 

MOV STORAGE, AX ;将 半径 的 平方 (作为 整数 ) 移 人 存储 器 

FILD STORAGE ; 移入 FPU 

FLDPI ; 载 人 pi=3.1415... 

FMUL ; 计算 底 的 面积 


此 时 ， 我 们 可 以 将 底 的 面积 从 FPU 移 至 ALU， 但 是 这 样 做 之 后 ， 我 们 会 丢掉 小 数 点 右面 
的 部 分 〈 即 损失 精度 ) 。 更 好 的 方案 就 是 继续 在 FPU 中 计算 ， 用 存储 单元 STORAGE 作为 整 型 
数据 的 临时 单元 。 重 申 要 点 : 圆锥 体积 是 相应 圆柱 体积 的 三 分 之 一 ， 而 圆柱 体积 等 于 底 的 面 
积 (已 经 算出 ) 乘 以 高 (150m) 。 因 此 ， 最 后 的 计算 过 程 如 下 : 


MOV STORAGE ，150 ; 将 高 度 载 人 FPU 

FILD ”STORAGE 

Mut STORACE 3 ; 圆柱 体积 = 底 的 面积 x 高 
， 3 移入 FPU 

FILD STORAGE :将 3 移入 FPU 用 于 除法 

FDIV ; 除 以 3， 求 圆锥 体积 


; 结果 现在 FPU 栈 顶 


FISTP STORAGE ; “P” 意 味 着 运算 执行 后 弹出 栈 (保存 ) 


，STORAGE 现 在 包含 最 终结 果 ， 舍 人 为 整数 
FwAIT ， 在 ALU 进 行 操作 之 前 等 待 FPU 完 成 


6.6 ”接口 问题 


前 面 例 中 的 代码 是 汇编 语言 程序 与 外 界 接 口 的 一 种 方式 ， 这 些 栈 帧 也 允许 高 级 语言 生成 
的 代码 (有 些微 小 的 变化 ， 需 注意 ) 来 操纵 。 因 此 ， 如 果 你 有 一 个 大 型 的 Pascal 或 者 C++ 程序 ， 
可 以 用 汇编 语言 编写 一 小 部 分 (一 个 或 几 个 函数 ) 以 确定 你 可 以 完全 控制 整个 机 器 一 一 例如 
获取 游戏 动画 效果 的 额外 的 加 速 。 

尽管 多 数 人 考虑 到 接口 时 通常 认为 是 与 设备 或 者 外 设 的 接口 。 例 如 ， 我 如 何 将 来 自 键盘 
(用 户 从 这 里 键入 ) 的 数据 送 至 CPU ， 然 后 送 至 屏幕 (数据 在 此 显示 ) ? 可 惜 答案 是 :“ 这 要 
看 具体 情况 ”。 

事实 上 ， 这 取决 于 很 多 事情 ， 你 使 用 的 设备 类 型 ， 你 所 用 的 机 器 种 类 ， 以 及 你 正在 运行 
的 操作 系统 的 类 型 。 实 际 上 ， 任 何 操作 系统 (Windows，Linux，MacOS，FreeBSD， 等 ) 都 
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是 一 种 特殊 的 计算 机 程序 ， 它 始终 都 在 运行 并 且 介 入 在 系统 上 的 其 他 程序 与 硬件 设备 之 间 。 
操作 系统 提供 并 且 控 制 对 输入 输出 设备 的 访问 一 这 意味 着 如 果 你 想 要 同 设备 打交道 ， 必 须 
调用 相应 的 函数 〈 由 操作 系统 提供 ) ， 并 借助 于 在 栈 中 设置 正确 的 参量 以 及 在 合适 的 位 置 发 出 
CALL。 这 些 函 数 的 细节 因 系 统 而 有 不 同 。Linux 系 统 采用 一 种 方式 工作 ， 使 用 一 组 函数 。 
Microsoft Windows 做 同样 的 事情 却 使 用 一 组 不 同 函 数 ， 它 需要 不 同 的 参量 及 调用 。 因 此 ， 要 
与 多 数 标准 设备 交互 ， 秘 密 在 于 理解 你 的 操作 系统 如 何 处 理 它 ， 然 后 使 用 与 操作 系统 的 神奇 
“握手 ” ， 让 操作 系统 去 完成 你 想 要 做 的 事 。 

有 其 他 两 个 主要 方 靶 与 设备 接口 。 一 些 设 备 ， 如 视频 控制 器 ， 可 以 直接 归属 到 计算 机 存 
储 器 上 并 且 当 相应 的 存储 内 容 改变 时 就 自动 地 更 新 。 显 然 这 个 存储 区 对 于 其 他 的 用 途 (比如 
存储 程序 ) 是 不 可 用 的 。 在 最 初 的 PC 上 (运行 MS-DOS ) ， 例 如 ,“ 视 频 存储 器 ”(VRAM) 起 
始 于 0xA0000， 这 意味 着 程序 不 能 使 用 超出 0x9FFFF 的 空间 。 然 而 ， 这 也 意味 着 一 个 聪明 的 程 
序 通过 将 合适 的 数据 放 在 合适 的 超出 0xA0000 的 位 置 上 就 能 在 屏幕 上 显示 该 数据 。 这 个 技术 ， 
称 为 存储 器 WO 上 映射， 可 以 很 容易 地 实现 ， 例 如 ， 将 ES 段 寄存 器 设置 为 0xA000， 然 后 使 用 寄 
存 器 对 如 ES:， AX 而 不 用 更 一 般 的 DS: AX 作 为 MOV 指 令 的 目标 变量 。 

其 他 设备 通信 方式 是 通过 不 同 的 端口 (如 串口 ，UDP 端 口 等 )。 这 通常 称 为 端口 LO 上 映射。 
每 个 这 样 的 端口 (以 及 其 内 部 不 同 的 数值 ， 如 视频 色彩 ) 都 可 用 一 个 16 位 的 端口 标识 号 进行 
独立 寻 址 。OUT 指 令 有 两 个 参量 ， 一 个 16 位 端口 和 一 个 8 位 数据 值 ， 仅 将 数据 值 传 到 端口 就 可 
将 该 数据 送 至 附加 在 该 端口 的 设备 中 。 设 备 对 该 数据 的 处 理 是 它 自己 的 事 。IN 指 令 将 从 指定 
的 端口 读 出 一 个 字 节 的 数据 。 显 然 ， 这 种 类 型 的 编程 需要 非常 了 解 端 口 编号 体制 以 及 数据 类 
型 和 含义 。 但 是 有 了 这 种 控制 ， 如 果 你 要 用 ， 你 就 可 以 将 你 的 壁挂 鱼 低 钩 到 8088 的 打印 端口 ， 
不 是 用 于 打印 ， 而 是 自动 控制 鱼缸 的 温度 和 换 气 。 


6.7 本章 回 顾 


。Intel 8088 是 系列 芯片 的 先驱 。 特 别 是 ， 作 为 最 初 JBM-PC 内 部 的 芯片 ，8088 很 快 就 成 为 商用 
桌面 机 的 最 常用 芯片 ， 并 且 确 立 了 IBM 和 Microsoft 作 为 20 世 纪 大 部 分 期 间 的 工业 霸主 地 位 。 
“8088 是 CISC 芯 片 设计 的 经 典 案例 ，CISC 世 片 拥 有 庞大 、 丰 富 的 指令 集 。 
"8088 有 8 个 16 位 的 寄存 器 ， 被 命名 为 “通用 ”寄存 器 (尽管 这 些 寄存 器 中 许多 都 有 特殊 
的 用 途 )， 以 及 一 些小 的 8 位 寄存 器 ， 这 些 8 位 寄存 器 在 物理 上 是 16 位 寄存 器 的 一 部 分 ， 
还 有 逻辑 上 (以 及 物理 上 ) 分 开 的 浮 点 单元 FPU 
*。 大 多 数 汇编 语言 操作 采用 两 变量 形式 ， 操 作 助 记 符 后 面 跟 目 的 变量 和 源 变 量 ， 如 下 : 
OP dest, src ; dest = dest OP src 
。 可 用 的 操作 包括 通常 的 算术 运算 (尽管 乘法 和 除法 有 特殊 的 格式 并 且 使 用 特殊 寄存 器 )、 
数据 传送 、 软 辑 运算 ， 以 及 若干 其 他 特殊 用 途 的 操作 功能 。 
。8088 支 持 多 种 寻 址 方式 ， 包 括 立 即 方式 、 直 接 方 式 、 间 接 方式 和 变 址 方式 。 
“。 浮 点 操作 在 FPU 中 进行 ， 使 用 基于 栈 的 标志 和 一 组 特殊 的 操作 (大 部 分 以 字母 F 开 头 )。 
。8088 支 持 标准 的 分 支 转移 指令 ， 也 支持 特殊 的 循环 指令 ， 使 用 CX 寄 存 器 作为 循环 计数 器 。 
。8088 在 存储 器 中 保存 数据 的 格式 与 在 寄存 器 中 保存 数据 的 格式 不 同 ， 这 会 使 编程 新 手感 
到 困惑 。 
*。 数组 和 串 使 用 邻接 存储 单元 实现 ， 也 有 特殊 用 途 的 串 原 语 操作 用 于 常用 的 串 /数组 操作 。 
“SP 和 BP 寄 存 器 通常 用 来 支持 具有 标准 栈 帧 的 标准 化 机 器 栈 ， 这 使 得 汇编 语言 代码 与 高 
级 语言 代码 的 结合 很 容易 。 
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6.8 习题 


1. “系列 芯片 ”的 含义 是 什么 ? 
2. 为 什么 8088 有 固定 数量 的 寄存 器 ? 
3. BX 和 BL 寄存 器 之 间 的 差别 是 什么 ? 
4. 下面 的 段 : 偏 移 所 对 应 的 实际 地 址 是 什么 ? 
a. 0000:0000 
b. ABCD:0000 
c. A000:BCDO 
d. ABCD:1234 
5. 在 JVM 中 没有 的 CISC 指 令 的 实例 ? 
6. 乘法 指令 和 加 法 指令 有 何 区 别 ? 
7.JA 和 J]G 之 间 的 区 别 是 什么 ? 
8. ADD WORD PTR [4000h]，1 和 ADD BYTE PTR [4000h]，1 之 间 有 何不 同 ? 
9. 8088 在 使 用 16 位 UNICODE 量 表示 字符 的 语言 (如 Java) 中 如 何 处 理 串 操作 ? 
10. 8088 程 序 中 所 谓 的 全 局 变量 是 如 何 保存 ? 
11. 子 程序 的 参数 以 自 左 至 右 还 是 自 右 至 左 的 次 序 进 栈 对 于 8088 有 影响 吗 ? 


第 7 章 ”Power 体系 结构 


7.1 背景 


对 基于 Intel 芯 片 设计 的 用 于 台式 机 的 CPU 而 言 ， 唯 一 最 大 的 竞争 者 可 能 就 是 Power 体 系 结 
构 。 直 到 2005 年 中 期 ，PowerPC 芯 片 一 直 用 在 Apple Macintosh 计 算 机 中 。 尽 管 Apple 已 经 转向 
了 基于 Intel 的 芯片 ，Power 体 系 结构 仍然 在 许多 应 用 领域 中 起 主导 作用 。 和 截至 2005 年 11 月 ， 世 
界 上 20 个 最 快 的 超级 计算 机 中 半数 使 用 基于 Power 的 芯片 ， 三 个 主要 的 游戏 平台 (Sony， 
Microsoft 和 Nintendo) 到 2006 年 底 全 都 计划 采用 Power 芯 片 实 现 控 制 台 。 在 嵌入 式 系统 中 ， 
2006 个 汽车 模型 中 约 有 一 半 使 用 基于 Power 的 微 控 制 器 (由 Freestyle 生 产 )。 

如 果 说 Pentium 是 复杂 指令 计算 CISC 体 系 结构 的 权威 示例 ，Power 芯 片 就 是 精简 指令 集 计 
算 RISC 体 系 结构 的 教科 书 版 本 。 

从 历史 的 角度 ，Power 体 系 结构 创始 于 1991 年 Apple、IBM 和 Motorola 的 联合 设计 项 目 。 
(注意 Intel 不 是 这 个 联盟 的 成 员 。 要 知道 Intel 由 于 基于 CISC 的 x86 系 列 已 经 占据 了 统治 市 场地 
位 ， 因 此 何必 参加 这 个 联盟 ? ) RISC 由 IBM 一 直 在 嵌 和 人 式 系统 ( 见 第 9 章 ) 中 使 用 了 近 20 年 ， 
被 认为 是 一 种 从 相对 较 小 的 (因此 廉价 的 ) 芯片 获取 高 性 能 的 方式 。 

RISC 计 算 的 关键 在 于 (如同 生活 中 的 很 多 事 ) 计算 机 程序 花费 大 部 分 时 间 去 做 一 些 相对 
常用 的 操作 。 例 如 ， 研 究 表 明 在 一 个 典型 的 程序 中 大 约 20% 的 指令 就 是 load/store 指 令 ， 即 数 
据 在 主 存 和 CPU 之 间 的 移动 。 如 果 工 程 师 能 够 加 倍 这 些 指令 的 操作 速度 ， 那 么 他 们 就 能 获得 
系统 整体 性 能 10% 的 改进 ! 所 以 ， 不 是 花 时 间 和 精力 去 设计 执行 复杂 任务 的 硬件 ， 他 们 的 任 
务 是 设计 执行 简单 任务 的 硬件 ， 以 使 任务 执行 的 性 能 好 、 速 度 快 。 另 一 个 极端 是 ， 增 加 不 常 
使 用 的 寻 址 方式 会 降低 每 条 指令 的 执行 性 能 ， 因 为 计算 机 必须 检查 每 一 条 指令 来 看 该 指令 是 
否 使 用 了 这 种 寻 址 方式 ， 这 需要 更 多 的 时 间或 者 昂贵 的 电路 系统 。 

一 个 典型 的 RISC 芯 片 体系 结构 通常 有 两 个 特别 的 方面 可 加 速 ( 并 简化 ) 计算 。 第 一 ， 指 
令 本 身 通常 是 固定 长 度 (对 于 Power PC， 所 有 指令 都 是 4 个 字 节 长 度 ， 对 于 Pentium， 指 令 长 
度 可 变 ， 在 1~15 字 节 之 间 )。 这 对 于 CPU 取 指令 部 分 可 以 完成 得 更 容易 并 且 更 快 ， 因 为 它 不 需 
要 花 时 间 考 虑 究竟 取 多 少 字 节 。 类 似 地 ， 二 进 制 模式 的 译 码 以 决定 执行 什么 操作 也 能 完成 得 
更 快 并 且 更 简单 。 最 终 ， 每 条 指令 都 足够 的 简单 从 而 可 以 快速 地 执行 〈 通 常 在 它 取 下 一 条 指 
令 的 时 间 里 执行 完成 一 一 单 周 期 ) 。 

RISC 体 系 结构 的 第 二 个 优点 与 指令 组 有 关 。 它 不 仅 能 很 快 地 执行 每 一 条 指令 ， 而 且 指 令 
集中 的 指令 数量 少 ， 这 意味 着 在 如 何 进行 给 定 的 (高 级 ) 计算 问题 上 通常 没有 大 量 的 近 义 变 
形 。 这 使 得 优化 的 编译 器 能 很 容易 地 分 析 代 码 。 更 好 的 分 析 可 以 产生 更 快 的 程序 ， 即 便 单 个 
的 指令 并 没有 加 速 。 

当然 ，RISC 体 系 结构 如 Power 不 足 的 一 面 就 是 大 部 分 功能 强大 的 操作 (例如 ， 第 6 章 描 述 
的 串 处 理 系 统 ) 不 作为 单独 的 指令 存在 ， 必 须 用 软件 来 实现 。 甚 至 许多 存储 器 访问 指令 和 方 
式 也 不 可 用 。 

Power 联 盟 的 设计 目标 之 一 就 是 不 仅 开发 有 用 的 芯片 ， 也 要 开发 交叉 兼容 的 芯片 。 当 然 ， 
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Motorola 和 IBM 已 经 建立 了 良好 的 独自 设计 的 芯片 系列 (例如 ， IBM 的 RS/6000 芯 片 以 及 
Motorola 68000 系 列 ) 。 通 过 事先 达成 某 种 原则 ， Power 联 盟 能 确保 他 们 的 芯片 可 彼此 互 操作 ， 
对 于 未 来 技术 的 改进 也 提前 进行 了 设计 。 如 同 80x86/Pentium 系 列 ， Power 是 芯片 系列 (包括 
FowerPC 了 系列 ) 一 一 但 是 与 80x86/Pentium 不 同 的 是 ， Power 设 计 提 前 考虑 了 可 扩展 性 。 

Power 对 灵活 性 方面 的 关注 已 经 带 来 了 奇特 的 效果 。 首 先 ， 与 Intel 系 列 不 同 ， 开 发 的 焦点 
不 是 生产 新 的 、 更 大 的 机 器 。 从 一 开始 ， 低 端 桌面 甚至 和 圣人 式 系统 控制 器 就 已 经 是 目标 市 场 
的 一 部 分 了 。( 这 一 市 场 优势 应 该 是 明显 的 ; 如 果 你 的 桌面 工作 站 与 你 的 烤箱 制造 厂 所 用 的 控 
制 艺 片 100% 兼 容 ， 编 写 和 调试 该 烤箱 的 控制 软件 就 很 容易 。 因 此 ， IBM 不 仪 能 卖 出 更 多 烤箱 
控制 器 芯片 ， 还 能 卖 出 更 多 工作 站 。) 与 此 同时 ， 该 联盟 计划 最 终 扩展 到 64 位 领域 (现在 典型 
代表 是 PowerPC G5) 并 且 定 义 一 个 最 初 (32 位 ) 设计 的 扩 展 指令 集 来 处 理 64 位 的 量 。 此 外 ， 
PowerPC 在 数据 存储 格式 方面 提供 了 大 量变 形 ， 这 在 下 面 将 会 看 到 。 


7.2 ”组织 和 体系 结构 


正如 大 多 数 现代 计算 机 ， 为 了 支持 多 任务 ， PowerPC 系 统 至 少 有 两 个 不 同 的 视角 (形式 
上 称 为 编程 模型 ， 也 常 称 作 编程 模式 ) 。 其 基本 思想 就 是 用 户 级 程序 只 具备 有 限 的 权限 能 访问 
计算 机 的 一 部 分 资源 ， 而 相当 一 部 分 计算 机 资源 超出 了 用 户 级 程序 的 访问 权限 ， 除 非 程序 
(典型 的 是 操作 系统 ) 运行 在 超级 用 户 的 特权 下 。 (8088 的 不 安全 性 就 是 由 于 缺少 这 样 明确 的 
编程 模型 。) 这 可 防止 用 户 程序 彼此 干涉 或 者 妨碍 关键 的 系统 资源 。 本 章 的 讨论 将 主要 关注 用 
户 模型 ， 因 为 这 是 与 日 常 编程 任务 最 相关 的 。 


7.2.1 中 央 处 理 单元 

通过 图 7-1 可 以 了 解 Power 体 系 结构 CPU 的 大 部 分 特征 。 有 一 组 “通用 寄存 器 ”， 数量 为 32 
个 《相对 较 多 ) ， 在 早期 的 PowerPC 型 号 如 601 (直到 G4) 中 是 32 位 宽 ， 而 在 G5 和 970 中 是 64 
位 宽 。 外 部 还 有 32 个 浮 点 寄存 器 ， 其 宽 为 64 位 。 ALU 和 FPU 两 者 都 有 状态 /控制 寄存 器 (CR 和 
FPSCR)， 并且 有 几 个 (相对 较 少 ) 芯片 特有 的 专用 寄存 器 ， 你 可 能 不 需要 用 它们 来 保持 
PowerPC 系 列 之 间 的 兼容 性 。 或 者 至 少 这 就 是 要 告诉 给 用 户 的 。 


CRO CR] CR2 CR3 CR4 CR5S CR6 CR7 


控制 寄存 器 (CR) 


CC- 


评点 状态 和 控制 寄存 器 “ 
(FPSCR) 


控制 单元 





图 7-1 PowerPC CPU 体系 结构 方 框图 


芝 7 间 Power 佚 和 姑 绪 欧 779 


实际 的 物理 布局 更 加 复杂 一 些 ， 因 为 有 些 专用 硬件 只 有 超级 用 户 (也 就 是 操作 系统 ) 可 
以 使 用 。 例 如 ， 有 一 个 机 器 状态 寄存 器 (MSR) 保存 系统 方面 的 超级 用 户 级 别 的 重要 信息 。 
(这 类 信息 的 一 个 例子 是 系统 当前 运行 在 用 户 级 还 是 超级 用 户 级 ， 也 许 是 由 外 部 设备 产生 的 响 
应 超级 用 户 级 事件 。 另 外 一 个 系统 方面 信息 的 例子 是 存储 器 存储 格式 是 采用 大 端 (big-endian) 
还 是 小 端 (little-endian) 格式 ， 后面 会 讨论 ,) 将 当前 的 计算 状态 (保存 在 CR 和 FPSCR 中 ) 
与 整个 机 器 状态 分 开 可 以 使 多 任务 环境 对 于 突 发 变化 的 响应 更 容易 一 些 ， 不 会 中 断 当 前 的 计 
算 。 一 个 更 加 微妙 的 优点 就 是 CPU 蕊 片 设计 者 能 够 复制 CR 和 FPSCR 并 允许 几 个 不 同 的 用 户 级 
程序 同时 运行 ， 每 个 程序 使 用 它 自己 的 寄存 器 组 。 这 个 过 程 在 理论 上 可 以 应 用 到 整个 用 户 级 
寄存 器 空间 。 特 别 地 ，PowerPC G5 复制 了 整 型 和 浮 点 处 理 硬件 ， 允 许 来 自 于 最 多 4 个 进程 的 
多 达 4 条 指令 完全 并 行 执行 。 

用 户 与 超级 用 户 对 CPU 必 片 视图 的 另 一 个 关键 区 别 是 关于 存储 器 访问 。 操 作 系统 必须 能 
访问 〈 并 且 真 正 控制 ) 计算 机 全 部 可 用 的 存储 器 ， 出 于 安全 的 理由 用 户 级 程序 通常 被 限制 在 
它 自己 的 空间 里 。PowerPC 有 一 组 固定 的 寄存 器 用 于 在 硬件 级 别 上 管理 存储 器 访问 ， 但 是 只 
有 超级 用 户 能 够 访问 这 些 寄存 器 。 下 一 节 将 描述 这 个 功能 。 


7.2.2 存储 器 

存储 管理 

在 用 户 级 ，PowerPC 存 储 器 组 织 简单 〈 比 8088 简 单 得 多 ) 。 每 个 用 户 程 序 都 拥有 32 位 地 址 
空间 ， 在 理论 上 可 访问 23? 个 不 同 的 一 维 存储 单元 。( 当 然 ， 对 于 64 位 版 本 的 PowerPC 存 在 2 个 
不 同 的 地 址 /单元 。) 这 些 单元 定义 了 程序 可 用 的 逻辑 存储 器 。 它 们 要 么 用 作 直 接地 址 (如 先 
前 所 定义 ) 要 么 用 作风 辑 地 址 ， 风 辑 地 址 由 存储 管理 硬件 进行 转换 。 此 外 ，PowerPC 定 义 了 
第 3 种 用 来 快速 访问 指定 的 存储 区 域 的 访问 方法 。 

块 地 址 转换 

如 果 一 个 特别 的 存储 器 块 需要 经 常 (而且 快 速 地 ) 被 访问 ，CPU 有 一 组 专用 寄存 器 ， 块 
地 址 转换 (BAT) 寄存 器 ， 用 来 定义 物理 存储 器 的 特殊 块 ， 可 以 用 于 执行 类 似 的 查找 任务 但 
只 要 很 少 的 步 只 。BAT 寄 存 器 最 常用 于 代表 高 速 数据 传输 的 存储 区 域 ， 例 如 图 形 设备 和 其 他 
类 似 的 VO 设备 。 如 果 一 个 逻辑 地 址 与 BAT 寄 存 器 标记 的 存储 区 对 应 ， 那 么 就 跳 过 虚拟 存储 过 
程 ， 进 而 从 BAT 寄 存 器 直接 读 出 对 应 的 物理 地 址 。 

cache 人 访问 

存储 器 访问 的 最 后 阶段 与 如 何 完成 访问 无 关 ， 而 是 要 决定 所 需 的 内 存 位 置 之 前 (近来 ) 
是 否 已 经 访问 过 ， 或 者 更 精确 地 ， 所 需 的 数据 是 否 保存 在 CPU 内 部 的 cache 中 。 因 为 片 内 存储 
器 的 访问 要 比 片 外 主 存 的 访问 快 很 多 ， 如 同 大 多 数 现代 处 理 器 芯片 ，PowerPC 将 近期 使 用 的 
数据 拷贝 在 一 个 很 小 但 速度 很 快 的 存储 器 中 。 


7.2.3 ”设备 和 外 设 

先前 定义 的 存储 管理 系统 的 另 一 特征 就 是 访问 IO 设备 能 在 存储 管理 系统 中 容易 地 处 理 。 
利用 BAT 寄 存 器 访问 高 速 O 设 备 已 经 提 到 过 。 类 似 的 方法 《IO 控制 器 接口 转换 ) 能 够 完成 虚 
拟 存储 系统 内 类 似 的 存储 器 地 址 任务 。 每 个 段 寄 存 器 包含 信息 以 及 VSID。 这 里 的 信息 域 详细 
指出 该 还 辑 地 址 是 否 指向 某 个 外 设 。 如 果 是 ， 就 跳 过 页 转换 ， 并 且 读 逻辑 地 址 用 来 产生 指令 
和 地 址 序列 来 处 理 适 当 的 设备 。 这 使 得 PowerPC 对 于 设备 访问 和 存储 器 访问 同样 容易 (实际 
上 就 像 存 储 器 访问 ) ， 只 要 操作 系统 在 段 寄存 器 中 正确 地 设置 了 数值 。 
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7.3 汇编 语言 


7.3.1 算术 运算 

PowerPC 汇 编 语言 与 我 们 已 经 看 到 的 系统 有 两 个 明显 的 不 同 。 第 一 ， 尽管 PowerPC 有 一 个 
寄存 器 组 (如同 x86 和 Pentium)， 但 是 寄存 器 采用 编号 而 不 是 名 字 。 第 二 ， Power 体 系 结构 指 
令 拥 有 独特 的 3 参量 格式 。 将 两 个 数 相 加 的 指令 可 写 为 ， 

add r3,r2,rl # 寄存 器 3 = 寄存 器 2 + 寄存 器 1 

注意 第 2 和 第 3 个 参量 (寄存 器 2 和 1) 在 计算 中 保持 不 变 (这 有 别 于 我 们 已 学 过 的 其 他 
CPU)， 因 此 可 以 在 后 来 被 重用 。 当 然 ， 通 过 参量 的 重复 ， 我 们 能 得 到 更 传统 的 操作 ， 例如 ， 

add r2,r2,rl # 等 价 于 x86 的 ADD R2，R1 

一 般 地 ， 二 进 制 操作 (算术, 逻辑， 其 至 比较 ) 会 以 这 种 方式 表示 。 这 种 3 参量 格式 ， 结 
合 相 对 较 多 的 可 用 寄存 器 ， 在 进行 计算 和 保存 中 间 结 果 方 面 给 程序 员 和 编译 器 带 来 了 巨大 的 灵 
活性 。 它 也 给 予 计算 机 一 定 的 余地 重新 按 需 动态 地 组 织 计 算 。 如 果 你 考虑 下 面 的 指令 序列 


add r3,r2,r1 才 (1) 寄存 器 3 Wo + 寄存 器 1 
add r6,r5,r4 ## (2) 与 上 面 的 类 

add r9,r8,r7 # (3) 

add r12,rLL,r10 #4) 

add r15,r14,r13 # (5) 

add r18,r17,r16 # (6) 


没有 理由 要 求 计算 机 一 定 按 上 述 次 序 执行 ， 有 足够 能 力 的 计算 机 其 至 能 够 同时 执行 这 些 
指令 。 

一 个 更 加 有 趣 的 问题 是 为 什么 Power 体 系 结构 以 这 种 3 参量 的 方式 工作 。 一 个 简单 的 回答 
是 ,“ 因 为 它 能 够 "。 在 设计 上 ，PowerPC 对 每 条 指令 都 采用 统一 的 并 且 相 当 大 的 位 数 一 一 32 
位 。 由 于 有 32 个 寄存 器 ， 指 令 用 5 位 指定 任 一 给 定 的 寄存 器 ， 所 以 指明 3 个 寄存 器 就 要 占用 32 
位 中 的 15 位 ， 这 还 意味 着 可 以 有 27 (大 约 128000) 个 不 同 的 3 参量 指令 可 用 。 显 然 ， 这 已 经 超 
出 任何 神志 正常 的 工程 师 的 设计 期 待 一 一 但 工程 师 们 不 是 让 add 指 令 比 其 他 的 指令 短 些 ， 而 是 
在 提供 额外 的 灵活 性 方面 为 特大 空间 找到 了 用 途 。 

然而 ， 有 一 个 领域 没有 提供 额外 的 灵活 性 ， 这 就 是 存储 器 寻 址 。 一 般 地 ，PowerPC 的 算 
术 和 多 辑 操作 不 能 访问 存储 器 。 正 式 地 说 ， 只 有 两 种 寻 址 方式 ， 寄 存 器 方式 和 立即 方式 ， 如 
前 面 章节 所 定义 。 不 同方 式 由 特殊 的 操作 码 和 助 记 符 区 分 ， 一 个 无 标记 的 助 记 符 针对 三 个 寄 
存 器 ， 而 以 -结尾 的 助 记 符 对 两 个 寄存 器 和 一 个 16 位 立即 值 进 行 操作 ， 例 如 : 


add r3,r2,r1l # 寄存 器 3 = 寄存 器 2 + 寄存 器 1 
addi r6,r5,4 # 寄存 器 6 = 寄存 器 5 +4 


(在 一 些 汇 编 器 中 ， 这 里 可 能 存在 一 些 困惑 ， 因 为 允许 程序 员 用 编号 引用 寄存 器 而 不 用 
标志 。 语 句 add 2，2，1 会 将 寄存 器 1 的 内 容 加 到 寄存 器 2 中 ， 它 不 是 加 数字 1。 要 做 得 更 好 

， 编 写 代码 时 就 不 要 粗心 ， 即 使 汇编 器 允许 你 这 么 做 。) 

当然 ,只 有 一 个 16 位 立即 值 可 用 (为什么? ) ， 我 们 不 能 对 一 个 32 位 寄存 器 的 高 半 部 分 进 
行 操作 。 有 些 操作 (add，and，or 和 xor) 采用 了 -is 作 后 缀 的 变形 (这 些 指令 对 立即 值 进行 
左 移 16 位 的 操作 ， 人 允许 程序 员 直 接 影 响 寄存 器 的 高 位 ) 。 所 以 语句 

andis r3,r3,FFFF # r3 = r3 and 0xFFFF06000 

将 用 32 位 模式 0xFFFF0000 与 I53 的 内 容 逻 辑 与 ， 因 此 将 寄存 器 的 低 半 部 分 置 为 0。 类 似 地 ， 

andis r3,r3,0000 # r3 = r3 and 0x0000000 

将 整个 寄存 器 清 零 。 当 然 ， 也 可 以 用 寄存 器 -寄存 器 操作 获得 如 下 相同 的 效果 ; 


人 7 蕴 Power 体 系 结 的 121 


xor r3,r3,r3 # 用 r3 与 其 自身 异 或 ( 清 零 ) 

subf r3,r3,r3 # r3 减 去 其 自身 ( 清 零 ) 

《即使 在 RISC 芯 片上 ， 也 有 多 种 方式 来 完成 同样 的 功能 。) 

你 所 期 待 的 大 部 分 算术 和 逻辑 操作 都 具备 了 ， 这 些 操作 有 加 (add，addi)、 减 (subf ， 
subfi)、 求 反 (算术 反 转 ，neg)、 与 (and，andi)、 或 (or，ori )、 异 或 (xor)、 与 非 
(nand)、 或 非 (nor) 、 乘 和 除 等 。 还 有 一 组 功能 强大 的 移 位 和 循环 移 位 指令 。 为 了 简化 芯片 
的 设计 逻辑 ， 不 是 所 有 的 这 些 操作 都 有 立即 形式 (毕竟 是 精简 指令 集 计 算 ) ， 但 是 很 少 会 有 程 
序 员 失去 立即 方式 nand 指 令 的 便利 。 一 些 汇 编 器 提供 了 助 记 符 别 名 一 例如 ，not 指 令 并 不 是 
由 PowerPC CPU 提供 的 。 它 能 用 来 模拟 “ 同 常数 0 的 nor”， 因 此 不 是 必须 由 PowerPC 提 供 。 反 
而 一 个 聪明 的 汇编 器 会 辨识 not 指 令 并 且 输 出 等 价 的 结果 而 没有 异议 。 像 通常 一 样 ， 乘 和 除 有 
些 复杂 。 经 典 的 问题 就 是 两 个 32 位 因子 相 乘 通常 会 产生 64 位 的 乘积 ， 它 无 法 装 入 一 个 32 位 的 
寄存 器 中 。 因 此 ，PowerPC 支 持 两 个 独立 的 指令 mullw 和 mulhw， 它 们 分 别 返 回 乘 积 的 低 字 和 
高 字 。 这 些 操作 都 使 用 通常 的 3 参量 格式 ， 所 以 

mullw r8,r7,r6 

计算 乘积 r7. r6 然 后 将 低 字 放 和 r8。 除 法 通常 分 为 有 符号 除 和 无 符号 除 ，divw 和 divwu。 
这 些 助 记 符 中 “w ”的 含义 表示 对 字 (word) 的 操作 。 


7.3.2 浮 点 操作 

对 于 浮 点 数 的 算术 指令 类 似 ， 但 是 要 用 64 位 浮 点 寄存 器 而 不 是 普通 的 寄存 器 ， 并 且 助 记 
符 以 一 个 { 开 头 。 因 此 两 个 浮 点 数 相 加 就 是 fadd。 软 认 情况 下 ， 所 有 浮 点 指令 都 对 双 精 度 (64 
位 ) 量 进行 操作 ， 但 是 内 部 有 一 个 s 的 变形 (和 如 ，faddsx) 指定 32 位 值 。 更 进一步 ，FPU 能 够 
以 整数 格式 存储 / 载 入 数据 ，FPU 自 身 能 够 处 理 浮 点 数 和 整数 之 间 的 转换 。 

在 PowerPC 上 编写 代码 的 一 个 危险 是 不 同 寄存 器 共享 相同 的 编号 。 例 如 ， 指 令 


fmul r7, r8, r9 # 浅 
add r7, r8, r9 # 加 


两 条 指令 好 像 对 同一 组 寄存 器 进行 操作 。 实 际 上 不 是 。 第 一 条 语句 对 浮 点 寄存 器 操作 ， 
而 第 二 条 是 对 通用 寄存 器 操作 。 在 一 些 汇 编 器 中 ， 在 恰当 的 场合 下 ， 自 然 数 也 被 解释 为 寄存 
器 编号 。 这 意味 着 语句 


add 7, 8,9 # 加 
addi 7, 8, 9 # 加 


完全 不 同 。 第 一 条 将 寄存 器 8 和 寄存 器 9 中 的 值 相 加 ， 而 第 二 条 将 寄存 器 8 中 的 值 与 立即 整 
型 常数 9 相 加 。 特 别 警 告 。 


7.3.3 ”比较 和 条 件 标志 

大 多 数 计算 机 在 缺 省 情况 下 会 在 每 个 算术 或 逻辑 操作 之 后 更 新 条 件 寄 存 器 相应 的 内 容 ， 
PowerPC 则 稍 有 不 同 。 第 一 ， 已 经 提 到 过 ，PowerPC 没 有 单一 的 条 件 寄 存 器 。 更 重要 地 ， 比 较 
只 在 明确 需求 时 进行 (这 有 助 于 支持 为 了 获取 速度 重 排 指令 次 序 的 思想 ) 。 最 简单 的 请 求 比较 
方式 就 是 在 整 型 操作 码 末 尾 添加 句点 符 (. )。 这 将 根据 运算 结果 大 于 、 等 于 或 者 小 于 零 来 设 
置 条 件 寄存 器 CR0 的 位 段 。 

更 一 般 地 ， 两 个 寄存 器 (或 者 寄存 器 与 立即 方式 的 常数 ) 之 间 的 比较 使 用 cmp 指 令 的 变形 。 
这 可 认为 是 最 奇特 的 3 参量 指令 ， 因 为 它 不 仅 带 有 两 个 要 比较 的 参量 (第 二 和 第 三 参量 ) ， 还 
有 条 件 寄存 器 的 索引 。 例 如 : 
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cmpw CR1, r4, rs5 # 比较 r4 和 r5 
# 结果 在 CR1 中 
设置 4 位 条 件 寄存 器 1 中 的 位 来 反映 r4 和 rs 的 关系 ， 如 表 7-1 所 示 。 
表 7-1 cmpw CR1，r4，r5 执 行 后 CR1 中 的 值 


该 位 设置 为 1 的 含义 





bit0 I4 <I5 (结果 小 于 0) 
bit1 r4 =r5 (结果 等 于 0) 
bit2 r4 >r5 (结果 大 于 0) 


7.3.4 ”数据 移动 

如 同 JVM， 要 将 数据 移入 /移出 存储 器 ， 可 用 专门 的 载 人 和 存储 指令 。 载 人 指令 一 般 有 两 
个 参量 ， 第 一 个 参量 是 目的 寄存 器 ， 第 二 个 参量 是 要 载 人 数据 的 逻辑 地 址 (也 许 要 经 过 存储 
管理 ， 前 面 已 描述 ) 。 和 JVM 一 样 ， 有 不 同 的 指令 对 应 不 同 大 小 的 数据 移动 ， 载 入 数据 的 指令 
都 以 字母 1 开头， 接 下 来 的 字符 指明 要 移动 的 数据 是 一 个 字 节 (b)、 半 字 (h，2 个 字 节 )、 字 
(w，4 个 字 节 ) ， 还 是 双 字 (d，8 个 字 节 ， 明 显 地 只 在 PowerPC 的 64 位 版 本 上 可 用 ， 因 为 只 有 
这 个 版 本 能 够 在 寄存 器 内 存储 如 此 大 的 量 )。 载 入 指令 显然 也 能 加 载 单 精度 (fs) 和 汉 精 度 
(fd) 浮 点 数 。 当 然 ， 不 是 所 有 的 数据 都 从 存储 器 载 入 。1i 指 令 用 立即 方式 载 入 常数 。 

当 载 入 量 少 于 一 个 字 时 ， 有 两 种 不 同 的 方式 填充 寄存 器 的 其 余部 分 。 如 果 指 令 指明 “ 零 
载 信 ”( 使 用 字母 z)， 寄 存 器 的 高 位 部 分 就 被 设置 为 0， 而 如 果 指 令 指 明 “ 代 数 载 和 信 ”(a)， 即 
对 寄存 器 的 高 位 部 分 进行 符号 扩展 。 最 后 ， 有 一 个 更 新 模式 可 用 ， 用 u 指 定 ， 将 在 下 面 解释 。 

要 了 解 下 面 的 实例 ,假设 (EA),“ 有 效 地 址 ”的 简写 ， 是 一 个 存储 单元 ， 该 单元 内 存 有 
适当 容量 的 存储 块 ， 目 前 保存 的 是 全 1 位 模式 。 指 令 1wz rl1，(EA) 将 位 于 (EA) 的 字 载 人 到 
寄存 器 1 中 并 且 (在 64 位 机 器 ) 将 寄存 器 其 余部 分 置 0。 在 一 个 32 位 PowerPC 上 ， 寄 存 器 1 将 包 
含 值 0xFFFFFFFF， 而 在 64 位 机 器 上 ， 寄 存 器 1 将 保存 值 0x00000000FFFFFFFF。 表 7-2 给 出 了 
载 人 指令 的 其 他 一 些 工 作 示例 。 


家 7-2 PowerPC 载 入 指令 的 一 些 示例 


指令 32 位 寄存 器 结果 64 位 寄存 器 结果 
lbz rl, (EA) 0x000000FF 0x00000000000000FF 
lhz rl，(EA) 0x0000FEFFF 0x000000000000FFFF 
lha rl1, (EA) 0x FFFFFFFF OxFFFFFFFFFFFFFFFF 
lwz rl, (EA) 0x FFFFFFFF 0x00000000FFFFFFFF 
ldr1, (EA) 不 允许 OxFFFFFFRFFFFFFFFF 


在 此 有 一 些 警告 。 也 许 最 明显 的 是 ， 即 使 在 一 个 64 位 机 器 上 ， 也 无 法 “扩展 ”一 个 64 位 
双 字 量 。 在 32 位 PowerPC 上 也 没有 办 法 直接 对 双 字 量 进行 操作 ， 或 者 32 位 CPU 中 没有 办 法 将 
字 进 行 代数 扩展 至 双 字 。 因 此 ，32 位 PowerPC 指 令 集 中 不 含 1wa 指 令 ,， 并且 1wz 指 令 载 人 一 个 
32 位 量 但 是 不 做 任何 零 扩展 。 最 令 人 困扰 的 ，PowerPC 体 系 结构 不 允许 对 字 节 量 进行 代数 扩 
展 ， 所 以 指令 1ba 也 不 存在 。 除 了 这 些 例外 ， 载 人 指令 非常 完备 并 且 很 好 理解 。 例 如 ， 指 令 
1su r3, (EA) 从 存储 器 载 人 了 一 个 单 精 度 浮 点 数 ， 使 用 了 迄今 为 止 还 未 定义 的 “更 新 ”和 
“索引 ”模式 。 

从 寄存 器 向 存储 器 存储 数据 的 操作 类 似 ， 但 是 以 “st” 开 头 并 且 不 用 考虑 扩展 问题 。 指 令 
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sth r6,，(EA) 将 寄存 器 r6 的 低 16 位 保存 在 EA 存储 单元 ， 而 sthu，sthx 或 者 sthux 指 令 完 成 同 
样 的 功能 ， 但 是 分 别 使 用 更 新 和 模式， 索引 模式 或 两 者 结合 。 


7.3.5 ”转移 

汇编 语言 程序 设计 最 后 一 个 基础 方面 就 是 控制 /转移 指令 。 正 如 我 们 所 期 待 的 ，PowerPC 
支持 无 条 件 和 条 件 转移 。 无 条 件 转移 的 助 记 符 就 是 一 个 简单 的 b， 带 有 单独 一 个 目标 地 址 。 条 
件 转移 指令 〈 有 几 种 变形 ， 统 称 为 by ) 包括 一 个 参量 和 条 件 寄存 器 ， 如 下 : 


bgt CRO, address # 如 果 CR0 的 位 1 被 置 1 则 转移 
bit CR1, address # 如 果 CR1 的 位 0 被 置 1 则 转移 
beq CR2, address 大 如 果 CR2 的 位 2 被 置 1 则 转移 
ble CR3, address # 如 果 CR3 的 位 1 被 置 0 则 转移 
bne CR4, address # 如 果 CR4 的 位 2 被 置 0 则 转移 
bge CR5, address # 如 果 CR5 的 位 0 被 置 0 则 转移 


PowerPC 不 支持 单独 的 跳 转 一 至 一 子 程序 指令 ， 但 是 有 一 个 专用 链接 寄存 器 完成 类 似 的 任 
务 。 还 有 一 个 用 于 循环 的 专用 计数 寄存 器 。 这 两 个 寄存 器 都 由 专用 的 指令 使 用 。 

尽管 RISC 设 计 简洁 ， 仍 然 有 很 多 可 用 的 指令 ， 我 们 不 能 一 一 介绍 。 特 别 是 ， 超 级 用 户 级 
寄存 器 如 BAT 和 有 段 寄存 器 都 有 自己 的 指令 进行 访问 。 如 果 需 要 为 Power 芯 片 编写 操作 系统 ， 那 
么 你 首先 需要 读 些 其 他 的 书 。 


7.4 再 论 锥 形 山 


再 来 看 我 们 的 老 朋 友 ， 锥 形 山 ， 这 是 我 们 已 经 举 过 的 例子 。 为 了 表示 的 简洁 性 ， 这 个 例 
子 假设 可 用 64 位 操作 。 同 样 为 简单 起 见 ， 假 设 r 值 在 存储 器 中 可 用 ， 表 示 为 存储 单元 (PD。 如 
第 2 章 所 述 ， 原 问题 描述 如 下 : 

底部 呈 圆 形 直 径 450m 并 且 高 150m 的 山体 体积 是 多 少 ? 

由 于 可 用 寄存 器 很 多 ， 解 决 该 问题 就 十 分 简单 了 : 

第 一 步 是 计算 半径 ， 用 直径 除 以 2 ， 然 后 再 求 其 平方 。 


1i r3, 450 # 直径 载 人 r3 

11 r4, 2 # 除 以 2 得 到 半径 
divw r3, r3, r4 关 将 半径 放 入 r3 
mullw r3，r3，r3 ## 半径 平方 

第 二 步 将 数据 (经 由 存储 器 ) 移 至 FPU。 
std (EA),r3 # 将 半径 平方 存 为 64 位 整数 
1df ri0, (CEA) # 载 和 半径 平方 
fcfid r9，r16 ## 转换 为 浮 点 

第 三 步 载 人 r， 并 与 其 相 乘 。 

1df r8, (PI) # 载 人 用 于 乘法 的 
fmu] r7, r8, r9 # 相 乘 

fcfid r9，rl10 # 转换 为 浮 点 


最 后 ， 载 入 高 度 (150) 并 作 乘 法 ， 然 后 将 最 终 量 除 以 3。 为 了 清除 起 见 ， 我 们 首先 以 整 
数 形式 加 载 ， 然 后 将 它们 传 给 浮 点 处 理 器 ， 如 下 : 


1i r5，150 # 载 人 高 度 

std (EA),r5 # 存 为 整数 

1df r6, (EA) # 将 高 度 载 入 FPU 
fcfid r6, r6 # 转换 为 泽 点 
fmul r7, r6, r7 # | 相 乘 

1i r5，3 # 载 人 常数 3 


std (CEA),r5 # 存 为 整数 
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1df r6, (EA) # 将 3 载 入 FPU 

fcfid r6，r6 # 转换 为 浮 点 

fmul r6, r6, r7 # 相 乘 

注意 在 这 个 例子 中 ， 寄 存 器 3 到 寄存 器 5 总 是 用 于 保存 整数 ， 因 此 一 直 是 通用 寄存 器 ， 而 
寄存 器 6 到 寄存 器 10 总 是 用 于 保存 浮 点 数 。 这 只 是 为 了 保证 解释 的 清晰 。 


7.5 ”存储 器 组 织 和 使 用 


一 旦 你 了 解 了 超级 用 户 级 存储 器 管理 ，PowerPC 存 储 器 组 织 就 简单 了 。 如 前 面 所 讨论 的 ， 
从 用 户 的 角度 ，PowerPC 提 供 了 一 个 简单 扁平 的 存储 空间 。 存 储 空间 的 容量 是 CPU 字 长 的 一 
个 简单 函数 一 一 对 于 32 位 CPU 是 2% 字 节 (大 约 4GB) 而 对 于 64 位 CPU 是 2% 字 节 。 当 然 ， 没 有 
计算 机 能 拥有 16EB 的 物理 存储 器 ， 但 是 这 个 容量 为 未 来 突破 存储 器 成 本 留 出 了 空间 。 存 储 器 
地 址 就 是 适当 容量 的 编号 : 半 字 ， 字 ， 和 双 字 在 存储 空间 中 按 适 当 对 齐 的 间隔 得 到 保存 。( 实 
际 上 ， 这 是 一 个 谎言 。 字 节 就 是 字 节 。 但 是 指令 例如 1d r0，(EA) 只 有 当 (EA) 指 向 一 个 8 的 倍 
数 的 有 效 地 址 时 才能 工作 。 否 则 ， 一 个 智能 的 汇编 器 /编译 器 就 需要 将 双 字 载 入 拆 分 成 8 个 部 
分 载 人 和 移 位 指令 ， 这 会 减 慢 代 码 的 速度 。 所 以 ， 不 要 采用 这 种 做 法 。 伴 装 对 象 已 经 按照 合 
适 的 对 齐 位 置 保存 ， 这 样 会 感觉 更 好 。) 

PowerPC 的 一 个 关键 特征 是 直接 支持 嵌入 到 CPU 指令 集 的 big-endian 和 1little-endian 数 据 存 
储 。 这 个 特征 继承 自卫 M 和 Motorola， 它 们 都 有 大 规模 的 产品 系列 和 大 量 的 代码 需要 支持 ， 但 
是 在 这 方面 做 出 了 不 同 的 选择 。CPU 中 的 数据 总 是 以 相同 的 方式 保存 ， 但 是 在 存储 器 中 数据 
要 么 以 正常 格式 要 么 以 “ 字 节 反 向 ”格式 存储 。 

除了 这 些 复杂 性 之 外 ， 存 储 器 寻 址 操作 相当 简单 。PowerPC 支 持 两 种 基本 寻 址 方式 ， 间 
接 寻 址 和 索引 寻 址 ;唯一 的 区 别 在 于 涉及 的 寄存 器 数量 。 

在 间接 方式 中 ， 计 算 机 用 16 位 立即 偏 移 值 与 单一 寄存 器 指定 的 内 容 之 和 作为 有 效 地 址 。 
例如 ， 如 果 寄 存 器 3 中 有 值 0x5678， 那 么 指令 

1wz r4，0x1000(r3) 

将 保存 在 0x6678 (0x1000+0x5678) 单元 的 值 载 和 到 寄存 器 4 的 低 32 位 〈(w) 。 在 64 位 的 机 
器 中 ， 因 为 z 所 以 高 32 位 被 设置 为 0。 对 于 大 多 数 程 序 而 言 ，0x1000 由 编译 器 定义 ， 指 向 某 个 
变量 的 偏 移 ( 如 上 所 示 )。 

在 索引 方式 中 ， 有 效 地 址 的 计算 也 类 似 ， 但 是 用 两 个 寄存 器 代替 一 个 常数 和 一 个 寄存 器 。 
所 以 ， 在 下 面 的 指令 中 

Twzx r4, r2, r3 

仅 当 寄 存 器 2 保存 0x1000 时 有 效 地 址 是 相同 的 。 这 提供 了 十 分 简单 但 是 有 用 的 两 步 方式 访 
问 存储 器 ， 第 二 个 参量 可 用 来 定义 一 个 特别 的 存储 块 一 例如 ， 全 局 程序 变量 的 存储 区 一 一 
而 第 三 个 变量 用 来 选择 该 块 内 的 一 个 偏 移 (这 在 思想 上 与 8088 定 义 的 段 寄 存 器 类 似 但 更 加 灵 
活 ) 。 如 果 出 于 某 种 原因 ， 该 块 作为 一 个 整体 被 更 换 ， 只 有 一 个 寄存 器 需要 改变 ， 整 个 代码 可 
以 继续 工作 。 

对 于 许多 应 用 而 言 ， 特 别 是 那些 涉及 数组 的 应 用 ， 访 问 存储 器 时 能 够 改变 寄存 器 值 将 是 
非常 方便 的 〈Java 程 序 员 已 经 熟悉 了 “++” 和 “--” 操 作 符 )。PowerPC 通 过 更 新 方式 提供 
这 类 功能 ， 在 助 记 符 中 用 u 表 示 。 在 更 新 方式 中 ， 有 效 地 址 的 计算 依旧 ， 但 是 寄存 器 内 的 值 被 
更 新 为 有 效 地 址 。 

举 个 例子 ， 考 虑 下 列 语句 的 效果 ， 这 可 能 在 一 个 循环 的 中 间 : 
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1wzu r4, 4Cr3) # 用 更 新 方式 访问 (r3+4) 

add r5, r5, r4 | # 保存 当前 的 总 和 ， 

假设 7z3 包 含 0x10000， 它 是 这 个 块 的 开头 ， 第 一 条 语 名 计算 有 效 地 址 为 0x10004 并 且 将 保 
存在 该 地 址 的 字 (4 字 节 ) 值 载 人 r4。 到 目前 为 止 ， 所 有 的 都 是 正常 的 。 这 个 载 人 完成 后 ，13 
的 值 将 被 更 新 为 有 效 地 址 0x10004。 下 次 邻近 4 字 节 存储 单元 ， 它 是 字数 组 内 下 一 个 元 素 的 访 
问 地 址 ， 此 时 r3 已 经 指向 了 那里 。 这 可 以 节省 很 多 时 间 和 精力 。 这 使 得 数组 处 理 或 者 更 一 般 
的 相似 元 素 集合 的 处 理 变 得 非常 高 效 。 

没有 专用 指令 用 于 子 程序 ， 不 存在 标准 化 、 硬 件 增 强 的 系统 栈 或 者 系统 栈 指针 概念 。 取 
而 代 之 ， 程 序 员 (更 可 能 ， 操 作 系 统 ) 借用 一 个 或 多 个 寄存 器 (通常 r1) 做 栈 指针 并 且 使 用 
标准 的 寄存 器 /存储 器 操作 来 代替 压 栈 和 出 栈 操 作 。 这 不 仅 维护 了 RISC 理 念 (既然 已 经 完成 处 
理 ， 为 什么 还 要 创建 专用 的 出 栈 指令 ? ) ， 而 且 人 允许 不 同 的 程序 和 系统 建立 不 同 的 栈 帧 。 再 者 ， 
Apple，IBM 和 Motorola 都 有 大 量 的 代码 基 要 得 到 支持 ， 它 们 对 栈 的 看 法 不 同 而 且 不 兼容 ， 所 
以 人 们 能 够 明白 这 个 委员 会 做 出 这 一 设计 准则 的 道理 。 


7.6 性 能 问题 


流水 化 

如 同 我 们 已 经 研究 过 的 其 他 芯片 ， 计 算 机 的 性 能 是 成 功 的 关键 。 每 个 新 型 计算 机 都 要 比 以 
前 的 快 。 为 了 实现 这 一 目标 ，PowerPC 提 供 了 大 规模 的 流水 化 体系 结构 ( 见 5.2.4 节 )。 使 JVM 
运行 更 快 的 一 个 不 费力 方式 就 是 在 一 个 更 快 的 芯片 上 执行 它 。 为 了 使 PowerPC 芯 片 运行 更 快 些 ， 
人 们 不 得 不 让 芯片 本 身 再 快 些 ， 或 者 用 某 种 方式 在 每 个 系统 时 钟 内 压缩 更 多 的 计算 。 为 了 做 
到 这 一 点 ，CPU 有 一 个 更 加 复杂 的 ， 流 水 化 的 取 指 -执行 周期 ， 允 许 同时 处 理 儿 条 指令 。 

RISC 体 系 结构 的 一 个 特征 就 是 良好 的 流水 化 工作 。 注 意 流水 线性 能 的 两 个 关键 是 保持 流 
水 线 一 直流 动 以 及 每 个 阶段 近似 均匀 。RISC 指 令 集 经 过 特别 设计 ， 所 有 的 指令 花费 同样 的 时 
间 ， 并 且 通 常 能 在 单机 器 周期 内 执行 。 所 以 ， 在 进行 取 指令 的 同时 机 器 还 能 执行 加 法 指令 ， 
并 且 流 水 线 始终 保持 平稳 。 这 有 助 于 解释 PowerPC 上 有 限 数目 的 寻 址 方式 ， 一 条 将 一 个 存储 
单元 与 另 一 个 相 加 的 指令 除了 简单 的 加 操作 之 外 还 需要 4 个 载 人 操作 和 1 个 保存 操作 ， 因 此 需 
要 4 倍 的 时 间 (拖延 流水 线 ) 。PowerPC 强 迫 这 个 操作 被 写成 4 条 分 开 的 指令 。 因 为 流水 化 的 操 
作 ， 这 些 指令 仍然 在 同一 时 间 进行 ,但 可 互相 协调 平稳 地 完成 整个 计算 ， 获 得 良好 的 性 能 。 

取 指 令 是 另 一 个 可 以 进行 优化 的 方面 。 对 于 Pentium， 指 令 长 度 可 变 ， 从 1 个 字 节 到 15 个 
字 节 。 这 意味 着 它 取 某 条 指令 的 时 间 会 是 另 一 些 指 令 的 15 倍 ， 而 当 一 个 非常 长 的 指令 被 载 信 
时 ， 流 水 线 的 其 余部 分 就 可 能 会 空 闪 。 相 比 之 下 ，PowerPC 中 所 有 的 指令 都 是 等 长 的 并 能 用 
单一 操作 载 入 ， 保 持 流水 线 是 充满 的 。 

当然 ， 有 些 类 型 的 操作 (例如 ， 浮 点 运算 ) 也 需要 大 量 的 时 间 。 为 了 解决 这 一 点 ， 浮 点 
运算 的 执行 阶段 本 身 被 流水 化 〈 例 如 ， 用 不 同 的 乘 、 加 以 及 伟人 阶段 进行 处 理 ) ， 以 便 它 仍然 
能 够 以 每 个 时 钟 周期 一 条 指令 的 吞吐 率 进 行 运算 。 有 时 ， 延 迟 也 是 不 可 避免 的 ， 有 一 种 机 制 
可 以 在 必要 的 时 候 让 处 理 器 停顿 ， 但 是 一 个 好 的 编译 器 能 够 编写 代码 尽 可 能 地 最 小 化 延迟 。 

另 一 种 情况 也 很 容易 中 断 流水 线 ， 就 是 载 人 不 适当 的 数据 ， 从 存储 器 中 不 适当 的 单元 取 
数 。 在 这 方面 最 坏 的 冒犯 者 就 是 条 件 转移 ， 如 “如 果 小 于 则 转移 " 。 一 旦 遇 到 这 条 指令 ， 下 一 
条 指令 要 么 来 自 于 指令 序列 中 邻近 的 下 一 条 ， 要 么 来 自 于 转移 目标 处 的 指令 一 一 我 们 可 能 不 
知道 是 哪 一 个 。 事 实 上 ， 我 们 通常 无 法 判定 需要 哪 条 指令 ， 因 为 条 件 取 决 于 计算 结果 ， 而 这 
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个 计算 将 在 流水 线 中 进行 ， 我 们 目前 无 法 得 到 计算 结果 。PowerPC 采 取 设 立 多 个 可 用 的 条 件 
寄存 器 来 辅助 ， 有 了 一 个 直通 的 流水 线 ， 当 转移 指令 开始 执行 时 ， 转 移 目标 已 经 被 确定 ， 正 
确 的 指令 即 可 被 载 入 。 

如 同 我 们 将 要 看 到 的 Pentium，Power 体 系 结构 也 吸纳 了 超标 量 体 系 结构 的 成 分 。 实 际 上 ， 
超标 量 设 计 与 RISC 体 系 结构 的 关系 要 比 CISC 芯 片 更 为 紧密 ， 但 是 好 的 设计 思想 就 是 好 的 设计 
思想 ， 往 往 会 被 广泛 采纳 。 回 顾 5.2.5 节 ， 这 一 设计 理论 吸纳 了 多 条 独立 不 相关 指令 能 在 CPU 
内 的 不 同 部 件 上 并 行 执行 的 思想 。 再 者 ，Power 体 系 结构 的 简化 指令 集 也 有 助 于 这 一 点 一 一 算 
术 运 算 与 载 人 /存储 操作 ， 或 者 比较 操作 分 离 ， 大 量 寄存 器 使 得 一 系列 指令 使 用 非 重 秋 寄存 器 
(因此 能 并 行 化 ) 变 得 更 容易 。 

典型 的 PowerPC CPU 用 独立 的 模块 处 理 不 同 种 操作 (如 同 早期 ALU 和 FPU 之 间 的 区 分 ， 
只 是 部 件 更 多 )。 通 常 ， 一 个 Power 芯 片 至 少 有 一 个 “ 整 型 单元 ”"、 一 个 “ 浮 点 单元 ”和 一 个 
“转移 单元 ”( 处 理 转 移 指令 ) ， 还 可 有 一 个 “ 载 人 /存储 单元 ”等 。PowerPC 603 有 五 个 执行 模 
块 ， 分 别处 理 整 型 运算 、 浮 点 运算 、 转 移 、 载 人/ 存储 以 及 系统 寄存 器 操作 。 对 于 更 高 端的 芯 
片 版 本 ， 常 用 单元 会 在 芯片 上 物理 复制 ， 例 如 ，PowerPC G5 芯片 有 10 个 独立 的 模块 ， 

。 1 个 交换 单元 (完成 专门 的 “交换 ”操作 ) 

。1 个 逻辑 运算 单元 

。2 个 浮 点 运算 单元 

。2 个 定点 (寄存 器 -寄存 器 ) 运算 单元 

。2 个 载 人 /存储 单元 

。1 个 条 件 / 系 统 寄存 器 单元 

。1 个 转移 单元 

借助 这 一 组 硬件 ，CPU 能 够 同时 (在 同一 取 指 -执行 周期 ) 执行 多 达 10 条 不 同 的 指令 。 在 
指令 队列 的 容量 范围 内 ， 第 一 条 载 人 /存储 指令 将 被 送 至 载 和 人 /存储 单元 ， 而 第 一 条 浮 点 指令 将 
被 送 至 浮 点 单元 ， 等 等 。 在 理论 上 你 能 理解 下 列 全 部 指令 完全 可 以 在 同一 时 间 内 完成 ， 


add r3,r2,r1i # 整数 相 加 

sub r4,r2,r1l 帮 另 一 个 定点 操作 

xor r5,r5,r5 # 使 用 逻辑 单元 清 零 r5 
faddx r7,r6,ré6 # 两 个 浮 点 数 相 加 
fsubx f8,r6,r6 # 使 用 浮 点 单元 清 零 r8 
b somewhere ## 转移 到 somewhere 


类 似 地 ， 这 些 指令 中 有 一 半 可 以 在 这 个 周期 执行 而 另外 一 半 在 下 一 个 周期 进行 ， 或 者 ， 
这 些 指令 每 次 执行 一 条 ， 但 是 以 方便 计算 机 的 次 序 ， 不 一 定 按照 编写 的 代码 次 序 。 

还 需要 一 些 特 殊 的 性 质 才 能 对 程序 代码 做 如 此 巧妙 的 处 理 。 首 先 ， 指 令 不 可 相互 依赖 ， 如 
果 上 述 第 2 条 指令 改变 了 寄存 器 4 的 值 〈 它 就 是 这 样 做 的 ) 并 且 第 5 条 指令 需要 使 用 这 个 新 的 值 ， 
那么 第 5 条 指令 就 至 少 要 到 第 2 条 指令 结束 之 后 才能 开始 。 然 而 ， 借 助 32 个 可 用 的 通用 寄存 器 ， 
一 个 智能 编译 器 通常 能 找 出 一 种 方式 在 寄存 器 之 间 分 布 计算 以 便 最 小 化 这 种 依赖 关系 。 相 应 地 ， 
指令 应 是 不 同类 型 的 ， 只 有 一 个 逻辑 单元 ， 每 次 就 只 能 执行 一 条 逻辑 指令 。 如 果 程 序 的 某 个 部 
分 由 连续 30 条 多 辑 指 令 组 成 ， 那 么 该 部 分 被 添加 到 指令 队列 而 且 只 能 每 次 分 派 一 条 指令 ， 基 本 
上 将 计算 机 减 慢 10 倍 。 此 外 ， 一 个 智能 编译 器 会 尝试 混合 代码 确保 队列 中 的 指令 类 型 不 同 。 


7.7 ”本章 回顾 
。PowerPC， 由 Apple、IBM 和 Meotorola 联 合 设计 ， 是 大 多 数 Apple 桌 面 计算 机 的 内 置 芯 片 。 
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它 是 RISC (精简 指令 集 计 算 ) 方法 设计 CPU 的 示例 ， 指 令 数 量 相对 较 少 ， 执 行 速 度 很 快 。 

。Power 体 系 结构 是 (主要) 来 自 Motorola 和 IBM 已 有 设计 的 灵活 折衷 。 直 到 近来 ， 
PowerPC 一 直 是 Apple 计 算 机 的 基本 芯片 ，Power 芯 片 仍然 主导 游戏 控制 台 领域 。Power 
心 片 实际 上 是 可 交叉 兼容 的 芯片 系列 ， 其 在 体系 结构 的 细节 中 又 有 很 多 不 同 。 例 如 ， 
PowerPC 存 在 32 位 字 长 和 64 位 字 长 两 个 版 本 ， 并 且 每 个 芯片 与 软件 交互 的 方式 都 极其 灵 
话 〈 例 如 ， 任 何 Power 艺 片 都 能 以 大 端 和 小 端 格式 存储 数据 ) 。 

“Power CPU 有 32 个 通用 寄存 器 和 32 个 浮 点 寄存 器 ， 还 有 专属 芯片 的 专用 寄存 器 ， 比 
Pentium/x86 的 寄存 器 要 多 。 该 芯片 也 对 几 种 不 同方 式 的 存储 管理 提供 硬件 支持 ， 包 括 
对 IO 设备 的 直接 (存储 器 映像 的 ) 访问 。 

。 为 了 处 理 速度 和 简易 性 ，Power 所 有 指令 都 是 等 长 (32 位 ) 的 。 

“Power 汇 编 语 言 用 3 参量 格式 编写 。 如 同 大 多 数 RISC 芯 片 ， 寻 址 方式 相对 较 少 ， 数 据 移 
入 移出 寄存 器 由 与 算术 运算 分 离 的 专门 载 入 /存储 指令 处 理 。 

“PowerPC 有 若干 不 同 的 条 件 寄存 器 (CRS)， 这 些 条 件 寄 存 器 能 独立 地 访问 。 

"为 了 加 速 世 片 ，PowerPC 利 用 流水 化 的 超标 量 体 系 结构 执行 指令 。 


7.8 习题 


RISC 世 片 与 CISC 芯 片 相 比 优点 是 什么 ? 缺点 是 什么 ? 
Power 体 系 结构 设计 的 灵活 性 有 哪些 实例 ? 
. 与 8088 系 列 相 比 Power CPU 为 什么 有 这 么 多 的 寄存 器 ? 
owerPC 算 术 指 令 采 用 3 参量 格式 的 优势 是 什么 ? 
and 和 andi 指 令 之 间 的 区 别 是 什么 ? 
and 和 andi ,操作 之 间 的 区 别 是 什么 ? 
PowerPC 为 什么 没有 标准 化 的 、 硬 件 支 持 的 栈 帧 格式 ? 
8. 对 于 流水 化 来 说 ， 为 什么 所 有 指令 等 长 很 重要 ? 
9. 由 JVM 提 供 而 不 是 PowerPC 直 接 提 供 的 指令 是 什么 ? PowerPC 如 何 实现 这 条 指令 ? 
10. 重 排 计算 次 序 是 如 何 加 速 PowerPC 程 序 的 ? 
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8.1 背景 


你 最 后 一 次 是 什么 时 候 问 计算 机 价格 的 ? 你 问 的 是 哪 种 计算 机 的 价格 ? 对 于 世界 上 大 多 
数 人 ， 第 二 个 问题 的 回答 可 能 都 是 “Pentium”。 由 Intel 制 造 的 Pentium 计 算 机 芯片 是 世界 上 最 
畅销 的 硬件 体系 结构 。 即 便 像 AMD 这 样 的 竞争 对 手 通常 也 会 非常 认真 地 确保 他 们 的 芯片 与 
Pentium 的 效果 一 样 ， 连 毛病 也 一 样 。 其 至 不 运行 Windows 的 大 部 分 计算 机 (例如 ， 大 部 分 
Linux 机 器 ) 也 使 用 Pentium 芯 片 。 

这 意味 着 可 预见 的 未 来 ， 如 果 你 必须 为 一 个 真实 (基于 硅 片 ) 计算 机 编写 汇编 语言 程序 ， 
可 能 就 会 为 Pentium 编 写 。 为 了 充分 发 挥 汇编 语言 的 速度 ， 你 必须 了 解 这 种 芯片 和 它 的 指令 集 ， 
以 及 如 何 使 用 。 

遗憾 地 ， 这 是 一 个 复杂 的 任务 ， 因 为 “Pentium” 本 身 是 一 个 复杂 的 芯片 ， 也 因为 
“Pentium” 这 个 术语 实际 是 指 一 个 系列 但 稍 有 不 同 的 芯片 。 最 初 的 Pentium， 早 在 20 世 纪 90 年 
代 制 造 ， 已 经 经 历 了 连续 的 发 展 ， 包 括 Pentium Pro、Pentium IH 、Pentium ,以 及 目前 的 
Pentium4 [P4J。 期 望 这 个 发 展 继续 ， 训 无 疑问 Pentium5 ，6，7 将 会 继续 ， 除 非 Intel 决 定 改变 
名 称 但 保持 系统 兼容 (就 像 380486 和 Pentium 之 间 所 发 生 的 改变 ) 。 

这 个 成 功 的 发 展 使 得 学 习 Pentium 体 系 结构 变 得 既 容 易 又 困难 。 由 于 最 初 Pentium (以 及 先 
期 的 x86 系 列 ) 的 巨大 成 功 ， 已 经 有 了 成 百 万 计 的 程序 是 为 前 期 的 芯片 版 本 编写 的 ， 人 们 仍然 
想 要 它们 运行 在 新 的 计算 机 上 。 这 就 造成 了 向 后 兼容 的 压力 ， 向 后 兼容 要 求 现代 计算 机 能 够 
毫 无 问题 地 执行 为 原 有 计算 机 编写 的 程序 。 所 以 ， 如 果 你 理解 了 Pentium 体 系 结构 ， 意 味 着 你 
理解 了 大 部 分 P4 体 系 结构 (以 及 x86 体 系 结构 )。 反 过 来 ， 每 项 新 措施 的 提出 会 增加 新 的 特性 
而 不 消除 老 的 特性 。 这 使 得 Pentium 几 平成 了 CISC 体 系 结构 的 接收 站 ， 因 为 曾经 需要 的 每 个 特 
性 依然 存在 一 一 每 个 设计 决定 无 论 好 坏 都 反映 在 当前 的 设计 中 。 不 像 JVM 的 设计 者 可 以 从 零 
记录 开始 ，Pentium 设 计 者 在 每 个 阶段 都 必须 从 现 有 的 系统 开始 ， 然 后 对 其 进行 增 量 地 改善 。 

这 使 得 CPU 必 片 的 基础 组 织 非常 复杂 ， 如 同一 个 房子 经 历 了 修补 ， 之 后 再 修补 ， 之 后 再 
修补 。 下 面 就 让 我 们 来 看 一 下 吧 …… 


8.2 组 织 和 体系 结构 


8.2.1 中 央 处 理 单元 

Pentium CPU 的 逻辑 抽象 组 织 与 前 面 描述 的 8088 体 系 结构 非常 相像 ， 只 是 多 了 些 内 容 。 特 
别 是 ， 有 更 多 寄存 器 ， 更 多 总 线 ， 更 多 可 选 内 容 ， 更 多 指令 ， 总 之 ， 每 件 事 都 有 更 多 方式 去 
做 。 同 8088 一 样 ， 仍 有 8 个 称 为 通用 的 寄存 器 ， 但 是 它们 已 经 被 扩展 成 能 容纳 32 位 的 量 并 且 有 
了 新 的 名 字 。 这 些 寄 存 器 现在 是 


EAX EBX ECX EDX 
ESI EDI EBP ESP 


实际 上 ，EAX 寄 存 器 (其 他 的 也 如 此 ) 只 是 原来 (16 位 ) AX 寄 存 器 的 一 个 扩展 。 如 同 
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AX 寄 存 器 被 分 成 AH/AL 对 ，EAX 寄 存 器 的 低 16 位 就 来 自 8088 的 AX 寄 存 器 。 由 于 这 个 原因 ， 
使 用 16 位 AX 寄 存 器 的 原 有 8088 程 序 能 继续 运行 在 Pentium 上 。 


EAX (32 位 ) 







未 使 用 AX (16 位 ) 


Tm | 


类 似 地 ，16 位 JP 寄存 器 已 经 变 成 EIP 寄 存 器 ， 这 个 扩展 指令 指针 包含 将 要 执行 的 下 条 指令 
的 存储 单元 地 址 。 不 再 是 原来 的 4 个 段 寄 存 器 ， 我 们 现在 有 6 个 段 寄存 器 (CS，SS，DS，ES， 
FS 和 GS) 用 来 对 经 常 使 用 的 区 域 进行 存储 器 访问 优化 。 最 后 ，EFLAGS 寄 存 器 保持 32 个 标志 ， 
不 再 是 原来 的 16 个 标志 。 除 了 段 寄存 器 之 外 ， 所 有 这 些 寄存 器 都 是 32 位 宽 。 这 就 意味 着 
Pentium 有 32 位 字 长 ， 并 且 大 多 数 操作 处 理 32 位 的 量 。 

除了 这 些 ，8088 与 Pentium 之 间 一 个 主要 的 变化 就 是 建立 了 不 同 的 操作 模式 支持 多 任务 。 
在 最 初 的 8088 中 ， 任 何 程序 都 可 自由 地 访问 全 部 寄存 器 集 ， 并 且 通 过 扩展 存储 器 以 及 挂 接 的 
外 部 设备 一 一 最 终 ， 完 全 控制 整个 系统 及 其 所 有 内 容 。 这 是 有 用 的 。 它 也 可 能 是 危险 的 ， 置 
着 着 人 古老 的 “战争 故事 ”的 风险 ， 作 者 的 早期 经 历 是 为 最 初 的 IBM-PC 编 写 高 速 图 形 程序 ， 
由 于 错误 地 将 图 形 数据 放 到 了 硬盘 控制 器 使 用 的 系统 存储 器 区 域 ， 当 试图 使 用 “被 修改 ”的 
参数 启动 时 ， 系 统 无 法 正确 地 工作 。 

为 了 防止 这 类 问题 ，Pentium 能 在 不 同 的 模式 下 执行 ， 这 些 模式 能 控制 执行 指令 的 种 类 ， 
也 能 控制 存储 器 地 址 的 解释 方式 。 两 个 特别 关注 的 模式 是 实 模式 和 保护 模式 ， 实 模式 基本 上 
是 8088 操 作 环境 的 详细 翻版 (每 次 运行 一 个 程序 , 只 有 1 兆 字 节 的 存储 器 可 用 , 没有 存储 保护 ) ， 
保护 模式 采用 后 面 (8.4.1 节 ) 描述 的 存储 管理 系统 支持 多 任务 。IBM-PC 最 初 的 操作 系统 MS- 
”DOS 运 行 在 实 模式 下 ， 而 MS-Windows 和 Linux 都 运行 在 保护 模式 下 。 


8.2.2 ”存储 器 

Pentium 支 持 不 同 的 存储 器 组 织 和 访问 方式 , 但 是 我 们 在 这 里 忽略 关于 它们 的 大 部 分 内 容 。 
首先 ， 它 们 非常 复杂 。 其 次 ，( 从 程序 员 的 观点 ) 多 数 复杂 的 部 分 是 从 古老 的 8088 体 系 结构 继 
承 来 的 。 如 果 你 必须 在 Pentium 上 编写 模拟 8088 实 模式 的 程序 ， 才 有 必要 了 解 这 些 内 容 。 当 你 
为 现代 计算 机 写 程序 时 ， 任 务 变 得 很 简单 。 将 存储 器 视 为 一 个 32 位 地 址 的 扁平 组 织 将 会 解决 
用 户 级 的 所 有 必要 工作 。 


8.2.3 设备 和 外 设 

Pentium 和 早期 8088 的 外 设 接 口 之 间 几 乎 没有 重大 差别 ， 这 也 是 由 于 Pentium 的 兼容 性 设 
计 。 当 然 ， 对 于 计算 机 厂家 而 言 这 是 一 个 巨大 的 优势 ， 因 为 用 户 能 够 买 到 新 的 计算 机 并 且 使 
用 原 有 的 外 设 ， 在 每 次 升级 主板 时 不 必 去 买 新 的 打印 机 和 硬盘 。 

然而 ， 随 着 计算 机 (和 外 设 ) 的 功能 变 得 愈 发 强大 ， 新 的 接口 方法 开始 使 用 ， 这 就 需要 
设备 和 IO 控制 器 去 做 更 多 的 工作 。 例 如 ，MS-DOS 编 程 中 直接 BIOS 控 制 需 要 标准 形式 来 访问 
保护 模式 编程 下 的 非 兼 容 硬 件 。 取 而 代 之 ， 用 户 级 程序 对 UVO 硬 件 的 访问 将 通过 操作 系统 来 控 
制 (并 且 限 定 ) 访问 设备 的 驱动 程序 请 求 。 





130 芝 二 六 分 丙 笑 矿 划 机 


8.3 ”汇编 语言 


8.3.1 ”操作 和 寻 址 

Pentium 指 令 集中 大 部 分 指令 直接 从 8088 继 承 而 来 。 理 论 上 ， 从 兼容 的 角度 讲 ， 任 何 为 
8088 编 写 的 程序 都 可 在 Pentium 上 执行 。Pentium 使 用 同样 的 两 参量 格式 ， 甚 至 在 多 数 情况 下 
助 记 符 都 是 相同 的 。 唯 一 主要 的 改变 就 是 更 新 了 寄存 器 助 记 符 来 反映 扩展 (32 位 ) 寄存 器 的 
使 用 ， 指 令 

ADD EAX, EBX ，32 位 寄存 器 到 32 位 寄存 器 的 加 法 

是 合法 的 ， 其 功能 很 明显 。 

许多 新 的 指令 得 以 创建 ， 明 显 针 对 32 位 的 量 。 例 如 ， 针 对 串 原 语 MOVSB 和 MOVSW ( 复 
制 一 个 字 节 / 字 串 ， 前 面 章节 定义 的 ) 已 经 加 入 了 一 条 新 的 MOVSD， 它 将 一 个 双 字 (32 位 ) 
串 从 一 个 存储 单元 复制 到 另 一 个 单元 。 


8.3.2 高 级 操作 

Pentium 也 提供 了 许多 全 新 的 操作 和 助 记 符 ， 这 里 不 能 一 一 描述 。 这 些 指令 中 很 多 (也许 
是 大 部 分 ) 都 是 执行 (常用 ) 任务 的 捷径 ， 与 使 用 简单 的 指令 相 比 所 需 的 机 器 指令 数 很 少 。 
例如 ， 一 条 指令 (BSWAP) 交换 一 个 32 位 寄存 器 (被 指定 作为 一 个 参量 ) 的 末 字 节 ， 这 个 任 
务 使 用 十 多 个 基本 的 算术 指令 才能 完成 。 另 一 个 例子 是 XCHG (交换 ) 指令 ， 它 将 源 和 目的 
参量 互相 交换 。 这 些 特定 操作 背后 的 基本 思想 是 功能 强大 的 编译 器 能 够 产生 高 度 优化 的 机 器 
代码 以 便 最 大 化 系统 性 能 。 

这 类 新 指令 的 另 一 个 例子 是 新 的 控制 指令 ，ENTER 和 LEAVE， 它 们 用 来 支持 高 级 语言 
淆 数 和 子 程序 的 语义 ， 这 些 高 级 语言 包括 C、C++、FORTRAN、Ada、Pascal， 等 。 如 6.4.7 节 
中 所 见 ， 这 些 语 言 中 的 局 部 变量 通常 放 在 子 程序 局 部 帧 系统 栈 的 临时 空间 。 新 的 ENTER 指 令 
在 将 控制 转移 到 一 个 新 位 置 时 大 量 地 复制 了 CALL 语 义 ， 将 原 有 的 程序 计数 值 保 存在 栈 中 ， 与 
此 同时 ， 它 构建 了 BP/SP 栈 帧 并 且 为 一 组 局 部 变量 预 留 了 空间 ， 因 此 用 一 条 相当 复杂 的 指令 赫 
代 了 半 打 简单 的 指令 。 它 也 为 如 Pascal 和 Ada 等 语言 (但 不 包括 C，C++ 或 FORTRAN) 的 冬 套 
声明 特性 提供 了 一 些 支持 。LEAVE 指 令 作 为 单一 指令 (尽管 十 分 奇特 ， 它 不 执行 从 子 程序 的 
返回 ， 所 以 仍然 需要 RET 指 令 ) 就 能 取消 栈 帧 创建 。 这 些 指 令 节 省 程序 代码 的 字 节 ， 但 是 
(与 设计 者 的 愿望 相悖 ) 作为 单一 慢 速 指令 它们 执行 所 花 的 时 间 要 比 被 它们 替代 的 一 组 指令 执 
行 所 花 的 时 间 还 长 。 

另外 特别 增加 用 来 支持 高 级 语言 的 指令 是 BOUND 指 令 ， 该 指令 检查 一 个 值 在 两 个 指定 上 
界 和 下 界 之 间 。 要 检查 的 值 作为 第 一 个 操作 数 给 出 ， 第 二 个 操作 数 指向 两 个 〈 邻 近 ) 存储 单 
元 给 出 上 界 和 下 界 。 这 人 允许 高 级 语言 编译 器 检查 一 个 数组 能 够 安全 地 访问 。 同 样 ， 这 可 用 更 
多 传统 的 比较 /转移 指令 完成 ， 但 是 要 用 半 打 指令 并 且 可 能 会 覆盖 一 些 寄存 器 。 取 而 代 之 ， 
CISC 指 令 集 用 最 小 的 努力 让 系统 完成 清晰 快速 的 操作 。 

多 种 操作 和 存储 管理 模式 需要 有 它们 自己 的 指令 组 。 这 样 的 指令 包括 VERR 和 VERW ， 它 
们 分 别 验证 某 个 段 能 够 被 读 出 或 是 写 人 。 另 一 个 例子 是 INVD 指 令 ， 它 清空 内 部 cache 存 储 器 
以 便 确 保 cache 状 态 与 系统 主 存 的 状态 是 一 致 的 。 

最 后 ，Pentium 不 断 的 发 展 ， 从 Pentium Pro 开 始 连续 经 过 PIH ，P 亚 和 P4， 已 经 给 基本 的 
Pentium 体 系 结构 增加 了 新 的 能 力 也 包括 新 的 指令 和 特性 。 例 如 ，Pentium 了 三 〈1999 年 ) 
增加 了 一 组 特殊 的 128 位 寄存 器 ， 这 些 寄存 器 中 的 每 一 个 都 能 装 入 4 个 〈32 位 ) 数 。 增 加 的 新 
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指令 中 有 “(专用 的 ， 当 然 了 ) 同 这 些 寄存 器 打交道 的 指令 ， 包 括 一 组 SIMD ( 单 指令 ， 多 数据 ) 
指令 , 这 类 指令 将 同样 的 操作 并 行 地 应 用 到 4 个 独立 的 浮 点 数 上 。 利 用 这 些 新 的 指令 和 寄存 器 ， 
浮 点 性 能 得 以 显著 地 增加 (大约 4 倍 )， 这 意味 着 计算 量 大 的 程序 如 计算 机 游戏 运行 速度 显著 
加 快 一 一 或 者 说 ， 好 的 程序 员 能 将 4 倍 高 质量 的 图 形 包 装 到 游戏 中 却 不 会 降低 其 速度 。 很 妙 ， 
是 不 是 ? 

此 时 ， 你 也 许 怀疑 怎么 可 能 记 住所 有 这 些 指令 。 答 案 是 ， 感 谢 上 帝 ， 并 不 期 待 你 这 样 做 。 
Pentium 指 令 集 是 庞大 的 ， 超 出 了 大 多 数 不 是 每 天 都 与 其 打交道 的 人 的 记忆 能 力 。 实 际 上 ， 只 
有 编译 器 需要 了 解 这 些 指令 以 便 能 够 选择 所 需要 的 指定 操作 。 


8.3.3 ”指令 格式 

与 其 他 的 计算 机 不 同 ， 特 别 是 大 多 数 Power 体 系 结构 计算 机 以 及 JVM，Pentium 不 要 求 所 
有 的 指令 等 长 。 取 而 代 之 ， 简 单 的 指令 一 一 例如 ， 一 个 寄存 器 -寄存 器 的 ADD 或 者 从 子 程序 返 
回 指 令 RET 一 一 仅 1 或 2 个 字 节 得 到 保存 并 解释 ， 可 以 快速 地 取出 而 且 在 存储 器 或 硬盘 中 占用 
的 空间 很 少 。 复 杂 的 指令 可 能 每 条 需要 高 达 15 个 字 节 。 

复杂 的 指令 会 包含 什么 信息 ? 最 明显 的 类 型 就 是 立即 方式 的 数据 ， 如 (十 分 明显 ) ，32 位 
数据 将 给 任何 指令 增加 4 字 节 的 长 度 。 类 似 地 ， 一 个 用 于 间接 寻 址 显示 (32 位 ) 命名 的 地 址 也 
增加 4 个 字 节 ， 所 以 指令 

ADD [EBX], 13572468H ; 向 存储 器 中 加 32 位 的 量 
至 少 比 简单 的 指令 超出 4 个 字 节 的 长 度 。( 在 前 面 的 章节 中 ， 我 们 已 经 明白 了 典型 的 RISC 蕊 片 
如 何 处 理 这 类 问题 ， 基 本 上 将 上 述 指令 拆 分 为 多 个 子 阶 段 。) 

除 此 之 外 ， 复 杂 的 指令 需要 更 多 的 信息 。 由 于 多 种 寻 址 方式 ，Pentium 要 用 更 多 的 位 ( 典 
型 的 是 1 个 字 节 ， 有 些 是 2 个 字 节 ) 来 定义 哪 种 位 模式 将 被 解释 为 寄存 器 、 存 储 器 地 址 等 。 如 
果 一 条 指令 使 用 了 非 标准 段 (不 是 缺 省 的 而 是 为 特种 指令 类 型 产生 的 )， 另 外 一 个 可 选择 的 字 
节 就 会 编码 这 个 信息 ， 该 信息 包括 要 使 用 的 段 寄存 器 。 用 于 串 操作 的 多 种 REP? 前 级 就 用 了 
另外 一 个 字 节 编码 。 幸 运 的 是 ， 这 些 复杂 性 相对 少见 ， 多 数 指令 并 不 采用 。 


8.4 存储 器 组 织 和 使 用 








存储 管理 

Pentium 存 储 器 最 简单 的 组 织 是 将 其 作为 一 个 32 位 扁平 的 地 址 空间 。 每 个 可 能 的 寄存 器 模 
式 代 表 了 存储 器 中 一 个 可 能 的 字 节 单 元 。 稍 大 些 的 模式 〈 由 于 传统 的 原因 ， 一 个 16- 位 字 节 模 
式 通 常 被 称 为 “ 字 ”， 而 一 个 32 位 字 被 称 为 “ 双 字 ”) 可 以 增补 两 个 或 多 个 邻近 的 字 节 单元 。 
只 要 计算 机 能 够 辨认 出 多 少 字 节 在 用 ,访问 长 度 变化 的 存储 单元 就 非常 简单 了 。 这 个 方法 也 
非常 快 ， 但 是 有 很 大 的 安全 隐患 ， 因 为 任 一 存储 单元 ， 包 括 操 作 系 统 或 者 在 该 机 器 上 执行 的 
其 他 程序 使 用 的 存储 单元 ， 都 可 能 被 自 改 。( 还 记得 我 的 硬盘 控制 器 吗 ) ? 所 以 ， 这 种 简单 的 
组 织 (经 常 被 称 为 不 分 段 页 的 存储 器 ) 很 少 使 用 ， 除 非 由 于 控制 器 芯片 或 者 其 他 需要 计算 机 
实时 、 快 速 地 执行 任务 的 应 用 。 

在 保护 模式 下 ， 需 要 额外 的 硬件 防止 程序 被 非 正常 修改 。 从 8088 继 承 来 的 段 寄 存 器 (CS， 
DS 等 ) 提供 这 方面 的 支持 。 和 8088 一 样 ， 通 用 寄存 器 表示 的 每 个 存储 器 地 址 将 被 解释 成 相对 
指定 段 的 地 址 。 然 而 ，Pentium 中 段 寄 存 器 内 容 的 解释 稍 有 不 同 。 两 个 16 位 用 作 保护 级 解释 ， 
而 其 余 的 14 位 定义 了 对 这 个 32 位 地 址 的 一 个 扩展 ， 这 样 创建 了 一 个 46 位 (14+32) 有 效 虚 拟 或 
逻辑 地 址 。 这 就 允许 计算 机 访问 超出 32 位 (4GB) 的 地 址 空间 并 且 将 存储 区 标记 为 某 些 程序 
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不 可 访问 的 ， 以 此 来 保护 私 用 数据 。 

然而 ， 要 通过 存储 器 总 线 (只 有 32 条 ， 因 此 用 32 位 地 址 ) 来 访问 ， 这 些 46 位 地 址 仍然 需 
要 被 转换 成 物理 地 址 。 从 这 些 虚 拟 地 址 到 32 位 物理 地 址 的 转换 任务 由 分 页 硬件 处 理 。Pentium 
包括 一 个 页 表 项 的 目录 ， 该 页 表 项 作为 这 个 转换 任务 的 翻译 系统 。 分 段 和 /或 分 页 硬件 的 使 用 
能 被 单独 地 启用 或 者 禁用 ， 这 就 允许 系统 用 户 (或 者 ， 更 加 可 能 是 操作 系统 的 编写 者 ) 针对 
某 个 应 用 来 调整 。 从 用 户 的 视角 ， 很 多 复杂 的 事情 都 由 硬件 处 理 了 ， 所 以 你 只 管 写 你 的 程序 
而 不 需要 担心 这 些 。 


8.5 ”性 能 问题 


8.5.1 流水 化 
改善 芯片 性 能 的 现代 标准 技术 是 流水 化 。 与 一 些 其 他 的 芯片 相 比 ， 尽 管 Pentium 的 指令 集 
不 太 适 于 发 挥 流水 化 的 优势 ， 但 是 它 还 是 充分 地 利用 了 这 项 技术 (如 图 8-1)。 
黄 至 在 Pentium 开 发 之 前 ，Intel 80486 就 已 经 采用 了 5 阶段 流水 线 执行 指令 。5 个 阶段 是 : 
。 取 指 ; 取出 指令 并 将 其 放 入 一 个 预 取 缓 冲 区 中 ， 预 取 缓冲 区 有 两 个 。 每 个 缓冲 区 都 能 保 
存 高 达 16 字 节 (128 位 )， 其 操作 与 流水 线 的 其 他 部 分 独立 无 关 。 
“ 译 码 阶段 1， 指 令 译 码 分 为 两 个 阶段 进行 ， 第 一 个 阶段 作为 指令 类 型 的 预 分 析 ， 决 定 在 
整个 指令 中 必须 提取 〈 以 及 从 哪 提取 ) 哪些 类 型 的 信息 。 有 具体 地 ，D1 阶 段 提 取 有 关 操 
作 码 和 寻 址 方式 的 基本 信息 ， 不 一 定 涉及 地 址 的 细节 。 
。 译 码 阶段 2:， 完成 指令 译 码 的 任务 ， 包 括 偏 移 和 立即 数 的 辨别 ， 产 生 ALU 控 制 信号 。 
。 执行 : 该 阶段 执行 指令 。 
* 写 回 : 该 阶段 用 上 一 阶段 产生 的 结果 更 新 寄存 器 、 状 态 标志 以 及 cache 存 储 器 。 


| 


U 指令 译 码 (ID1) v 


指令 译 码 (ID2) 


| 


| 


写 回 (WB 





图 8-1 Pentium 5 阶段 流水 线 示意 图 ， 包 含 超标 量 U 和 V 流 水 线 
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这 个 流水 线 比 我 们 已 看 到 的 其 他 流水 线 (如 Power 芯 片 的 ) 更 复杂 ， 部 分 原因 是 它 要 处 理 
的 指令 集 的 复杂 性 导致 的 。 注 意 Pentium (甚至 486) 指令 长 度 从 1 到 15 个 字 节 之 间 变 化 。 这 是 
预 取 缓冲 区 需要 这 么 大 空间 的 部 分 原因 ， 它 们 必须 能 完全 容纳 下 一 条 指令 。 也 是 由 于 相同 的 
原因 ， 需 要 花 很 长 时 间 译 码 复杂 指令 一 一 有 时 和 执行 一 条 简单 指令 时 间 一 样 ， 其 至 比 这 还 长 。 
寻 址 方式 的 数量 和 复杂 性 是 主要 因素 ， 因 为 它们 为 简单 的 逻辑 或 算术 操作 增加 了 额外 的 解释 
层 。 出 于 这 个 原因 ， 就 有 两 个 分 开 的 译 码 阶 段 以 便 保持 流水 线 平 稳 快 速 地 流动 。80486 能 够 以 
接近 每 个 机 器 周期 一 个 操作 的 速度 执行 不 含 存储 器 访问 的 大 多 数 操作 。 即 使 如 此 ， 间 接地 址 
(寄存 器 中 的 值 作为 存储 器 地 址 ) 以 及 转移 都 能 减 慢 流水 线 。 

流水 化 在 Pentium 及 其 后 来 版 本 中 使 用 相当 广泛 。 不 仅 有 多 条 流水 线 (反映 超标 量 体 系 结 
构 ) 而 且 每 条 流水 线 还 有 更 多 的 阶段 。 初 期 的 Pentium 有 两 条 流水 线 ， 每 条 流水 线 有 5 个 阶段 ， 
如 上 所 列 。Pentium L 增加 了 流水 线 的 数量 ， 并 且 将 每 条 流水 线 的 阶段 数 增加 到 12， 包 括 一 个 
判断 每 条 指令 长 度 的 特殊 阶段 。Pentium 严 使 用 14 阶 段 流水 线 ，P4 使 用 24 阶 段 流水 线 ， 在 此 无 
法 做 详细 讨论 。 尽 管 没 有 为 流水 线 设 计 有 效 的 指令 集 ，Pentium 还 是 将 流水 线 使 用 到 了 极致 。 


8.5.2 并行 操作 

为 了 允许 真正 的 并 行 操作 一 一 在 CPU 内 同时 执行 两 条 指令 ，Pentium 采 用 了 其 他 两 个 重要 
的 体系 结构 特性 。 自 Pentium I 开始， 指令 集 以 MMX 指 令 为 特色 专门 服务 多 媒体 应 用 ， 如 高 
速 图 形 (游戏 ) 或 者 声音 (同样 也 是 游戏 ) 。 这 些 指令 实现 了 SIMD ( 单 指令 ， 多 数据 ) 类 别 
的 并 行 ， 这 里 对 几 个 独立 的 数据 执行 同一 个 操作 。 

典型 的 多 媒体 应 用 涉及 处 理 相对 少量 的 数值 数据 构成 的 大 型 数据 阵列 〈 例 如 ， 屏 幕 图 像 
中 的 像素 ) ， 并 对 每 个 数据 执行 同样 的 运算 ， 运 算 速 度 之 快 以 致 于 察觉 不 到 图 像 的 闪烁 。 为 了 
支持 这 个 操作 ，Pentium 工 定义 了 一 组 MMX 寄存 器 ， 每 个 寄存 器 都 是 64 位 长 ， 保 存 8 个 字 池 ， 
4 个 字 ，2 个 双 字 ， 或 者 不 常用 的 8 字 节 四 字 。MMX 指 令 定义 了 在 一 个 寄存 器 的 所 有 元 素 上 同 
时 执行 统一 操作 。 例 如 ，PADDB ( 字 节 并 行 加 ) 指令 对 8 个 独立 的 字 节 执行 8 个 加 法 ， 而 
PADDW 对 4 个 字 同 时 执行 4 个 加 法 。 对 于 一 个 简单 的 操作 如 显示 一 幅 简 单 的 基于 字 节 的 图 像 ， 
数据 处 理 的 速度 会 是 使 用 普通 8 位 操作 的 8 售 。 


8.5.3 超标 量 体 系 结构 

如 前 面 所 讨论 的 (5.2.5 节 )， 另 一 个 重要 的 并 行 指 令 技术 涉及 流水 线 阶 段 的 复制 ， 甚 至 是 
整个 流水 线 的 复制 。 流 水 化 的 难点 是 保持 各 阶段 的 平衡 ， 如 果 执 行 一 条 指令 比 取 指令 花 的 时 
间 长 得 多 ， 就 应 将 执行 的 后 续 阶 段 重复 设置 。 初 期 的 Pentium 使 用 80486 的 5 段 流 水 线 ， 但 是 复 
制 了 关键 阶段 ， 建 立 了 双流 水 线 ， 称 为 U 流 水 线 和 V 流 水 线 。 指 令 可 以 轮流 在 这 两 条 流水 线 之 
间 执 行 ， 如 果 两 条 流水 线 无 障碍 ， 甚 至 两 条 同时 执行 。 更 一 般 地 ， 超 标量 体系 结构 具有 多 条 
流水 线 或 者 在 流 水 线 的 特定 阶段 有 多 个 执行 部 件 用 来 处 理 不 同 种 类 的 操作 〈 如 同 早 期 ALU 和 
FPU 之 间 的 区 分 ， 这 里 只 是 部 件 更 多 了 )。 

Pentium 的 后 期 模型 ， 从 Pentium I 开始 ， 还 在 继续 扩展 。 特 别 指出 ，Pentium LL 的 译 码 阶 
段 1 (ID1) 或 多 或 少 地 被 复制 了 三 次 。 理 论 上 ， 这 意味 着 ID1 阶 段 要 花费 其 他 阶段 的 3 倍 时 长 
却 没 有 显著 减 慢 整 个 流水 线 。 实 际 上 ， 情 况 非常 复杂 。 第 一 个 指令 译 码 器 能 处 理 中 等 复杂 的 
指令 ， 而 第 二 和 第 三 个 译 码 器 只 能 处 理 非常 简单 的 指令 。 因 此 ，Pentium I 硬件 包括 一 个 特殊 
的 取 指 令 阶 段 ， 它 将 重新 排列 指令 使 其 与 译 码 器 匹配 ， 所 以 ， 指 令 队 列 中 紧邻 的 三 条 指令 如 
果 其 中 之 一 是 复杂 指令 ， 就 自动 将 其 放 在 译 码 阶段 1。 由 于 这 些 复杂 的 指令 非常 少见 ， 没 有 必 
要 考虑 给 第 二 和 第 三 个 译 码 器 增加 这 种 (昂贵) 能力。 最后， 对 于 非常 复杂 的 指令 ， 还 有 第 
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四 个 译 码 器 ， 微 码 指令 序列 器 (MIS)。 

在 执行 阶段 还 有 一 个 硬件 单元 的 复制 。 流 水 线 的 一 个 特殊 阶段 ， 重 排 缓 冲 器 (ROB ) ， 接 
受 指令 并 且 将 指令 分 发 到 多 达 5 组 不 同 的 执行 单元 。 这 些 单元 处 理 多 种 指令 ， 例 如， 载 入 指令 ， 
存储 指令 ， 整 型 操作 (分 为 “简单 ”和 “复杂 ”类 型 )， 浮 点 指令 〈 也 有 类 似 划分 ) ， 以 及 一 
些 不 同 的 MMX 指令 。 


8.6 再 论 RISC 与 CISC 


已 经 花 了 几 章 来 描述 RISC 和 CISC 体 系 结构 之 间 的 区 别 了 ， 你 可 能 已 经 注意 到 实际 的 区 别 
很 小 (RISC) Power 芯 片 和 (CISC) Pentium 两 者 采用 很 多 同样 的 技术 来 获得 机 器 的 最 大 
合理 性 能 。 竞 争 使 得 两 个 集团 都 愿意 采用 对 方 好 的 思想 ， 这 是 一 部 分 原因 。 更 重要 地 ， 随 着 
技术 的 改进 ， 系 列 本 身 变 得 模糊 了 。 摩 尔 定律 表明 放 在 适度 容量 微 晶 片上 的 晶体 管 密度 以 及 
电路 数量 正 以 非常 快 的 速度 变 得 越 来 越 大 。 反 过 来 ， 这 意味 着 即使 “精简 ”指令 集 芯片 也 能 
有 足够 的 电路 包含 常用 的 指令 ， 即 便 这 些 指令 是 复杂 的 。 

与 此 同时 , 硬件 已 经 足够 的 快 ， 人 允许 非 常 小 规模 的 软件 仿真 传统 的 硬件 功能 。 这 个 方法 ， 
称 为 微 程序 设计 ， 意 味 着 在 CPU 中 用 其 自己 的 微 指令 集 创建 CPU。 一 条 复杂 的 机 器 指令 一 一 
例如 ，8088/Pentium MOVSB 指 令 将 字 节 串 从 一 个 单元 移 到 另 一 个 单元 一 一 可 以 在 微 指 令 级 实 
现 ， 通过 特有 的 微 指令 序列 ， 每 次 移动 一 个 字 节 。 宏 指令 将 被 翻译 成 数量 可 能 很 多 的 微 指令 
序列 ， 这 些微 指令 来 自 于 程序 员 不 可 见 的 微 指令 缓冲 区 ， 每 次 执行 一 条 。 

这 个 翻译 是 Pentium 超 标量 体系 结构 中 ID1 译 码 器 的 工作 。 第 二 和 第 三 个 译 码 器 只 能 将 指 
令 翻 译 成 简单 的 微 指令 ， 第 一 个 译 码 器 能 够 处 理 更 加 复杂 的 指令 ， 产 生 多 达 4 条 微 指令 。 对 于 
更 加 复杂 的 指令 ，MIS 作 为 查找 表 保存 多 达 上 百 条 微 指令 ， 这 些微 指令 针对 于 Pentium 指 令 集 
中 真正 复杂 的 部 分 。 

在 一 个 更 加 若 学 的 层面 上 ,具有 讽刺 意义 的 是 Pentium (正如 所 实现 的 ) 是 一 个 RISC 芯 片 。 
各 类 执行 单元 核心 中 的 独立 微 操作 正 是 严格 RISC 设 计 核 心 的 小 规模 、 快 速 的 操作 。RISC 的 主 
要 不 足 一 一 它 需 要 精致 的 编译 器 来 产生 合适 的 指令 集合 一 一 不 是 由 精致 的 编译 器 /解释 器 进行 
处 理 ， 而 是 利用 CISC 指 令 集 作为 近 平 中 间 表 达 层 进行 处 理 。 用 高 级 语言 编写 的 程序 被 编译 成 
CISC 指 令 集 可 执行 文件 ， 然 后 ， 在 执行 时 再 被 重新 转换 成 RISC 类 微 指令 。 


8.7 ”本 章 回顾 


。Intel Pentium 是 一 个 芯片 系列 一 世界 上 最 著名 并 且 最 畅销 的 CPU 芯 片 。 部 分 归于 有 效 
的 市 场 营销 ， 部 分 归于 前 期 类 似 芯片 如 x86 系 列 的 成 功 ，Pentium (以 及 第 三 方 克隆 
Pentium， 如 AMD 世 片 ) 已 经 被 确立 为 基于 Windows 和 Linux 的 计算 机 选择 的 CPU 芯片 。 
。 一 方面 作为 CISC 设 计 的 产物 ， 另 一 方面 作为 对 遗留 的 改进 以 及 向 后 兼容 ，Pentium 是 一 
个 复杂 的 芯片 ， 拥 有 庞大 的 指令 集 。 

。 可 用 的 操作 包括 通常 的 算术 操作 〈 乘 和 除 有 专门 的 格式 ， 并 使 用 专门 的 寄存 器 ) ， 数 据 传 
送 ， 逻辑 操作 ， 以 及 一 些 其 他 专用 操作 捷径 。 整 个 8088 指 令 集 都 可 用 ， 支 持 向 后 兼容 。 

。Pentium 包 含 大 量 专用 指令 以 便 支持 特别 的 操作 。 例 如 ，ENTER/LEAVE 指 令 支持 程序 类 
的 操作 ， 源 于 编译 高 级 语言 如 Pascal 和 Ada。 

“Pentium I 提供 了 一 组 多 媒体 (MMX) 指令 ， 用 来 支持 简单 算术 操作 的 指令 级 并 行 。 
MMX 指令 集 支持 SIMD 操 作 一 一 例如 ， 同 时 执行 8 个 分 开 的 独立 加 或 者 逻辑 操作 ， 而 不 
是 每 次 只 执行 一 个 操作 。 














沼 8 芋 Intel Pentium 


。 Pentium 也 吸纳 了 广泛 应 用 的 流水 化 和 超标 量 体 系 结构 ， 提 供 真 正 的 MIMD 并 行 。 


*。 Pentium 的 实现 包含 RISC 核 ， 在 此 ，CISC 指 令 是 用 RISC- 类 微 指令 实现 的 。 


8.8 习题 


1. 8088 和 Pentium 之 间 有 哪 四 个 主要 不 同 ? 

2. 指出 Pentium 中 含有 但 8088 中 没有 的 4 条 指令 。 

3. 为 什么 Pentium 有 两 个 译 码 阶段 ,但 是 只 有 一 个 执行 阶段 ? 
4. SIMD 并 行 如 何 使 计算 机 屏幕 上 光标 /指针 平滑 移动 ? 

5. Pentium 中 重 排 取出 的 指令 的 目的 是 什么 ? 
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9.1 背景 


微 控制 器 是 在 设备 内 部 用 于 小 规模 控制 操作 的 特种 计算 机 ， 人 们 通常 不 认为 微 控 制 器 是 计 
算 机 。 这 类 设备 的 经 典 案例 包括 交通 灯 、 烤 箱 、 恒 温 器 以 及 电梯 ， 但 是 更 好 的 、 更 细致 的 类 型 
是 现代 汽车 中 安装 的 微 控 制 器 。 例 如 ， 防 锁 死 制 动 由 微 控 制 器 监视 制 动 系统 并 且 当 车 轮 锁 死 时 
(汽车 会 打滑 ) 切 人 。 微 控制 器 的 其 他 用 途 包括 引爆 气囊 、 调 节 燃 油 混 合 器 减少 排放 ， 等 等 。 
根据 Motorola (一 家 微 榨 制 器 厂商 ) ， 仅 低 端 2002 型 客车 就 包含 了 15 个 微 控 制 器 ， 一 个 具备 更 
好 的 娱乐 和 安全 特性 的 豪华 轿车 通常 有 100 多 个 微 控制 器 。 这 些 数字 一 直 以 来 都 在 增长 。 

没有 关于 微 控 制 器 的 正式 定义 ， 但 是 它们 通常 有 三 个 主要 特征 。 第 一 ， 它 们 通常 用 在 所 
谓 的 伐 入 式 系 统 中 ， 作 为 一 个 大 系统 的 部 分 运行 特定 的 单 用 途 代码 ， 而 不 是 通用 可 编程 的 计 
算 机 。 第 二 ， 它 们 往往 是 小 型 、 功 能 较 少 的 计算 机 。(Zilog Z8 Encorel 微 控制 器 使 用 8 位 字 ， 
运行 频率 20MHz， 只 能 访问 64K 的 存储 器 ， 大 约 卖 $4。 与 之 相 比 ，Pentium4 处 理 器 能 够 轻松 
地 卖 到 $250 以 上 ， 而 且 仅 一 个 裸 处 理 器 一 一 没有 存储 器 无 法 单独 使 用 。) 第 三 ， 微 控制 器 通常 
是 单 芯 片 器 件 ， 它 们 的 存储 器 和 多 数 外 设 接口 都 位 于 同一 个 物理 芯片 上 。 这 在 目前 很 普通 ， 
因为 几乎 所 有 现代 计算 机 体系 结构 都 有 位 于 CPU 芯片 上 的 cache 存 储 器 。 其 重要 意义 在 于 一 个 
微 控 制 器 可 用 的 存储 器 根据 定义 就 是 全 部 cache 存 储 器 ， 因 此 虽然 容量 小 但 是 速度 快 。 

在 本 章 ， 我 们 将 详细 讨论 Atmel 公 司 生 产 的 AVR 微 控制 器 。 当 然 ，AVR 不 是 这 类 计算 机 中 
的 唯一 ， 微 控制 器 是 个 商品 部 件 ， 销 量 数 以 亿 计 。 这 个 领域 竞争 非常 激烈 ， 其 他 制造 并 销售 
微 控 制 器 的 公司 包括 Microchip、Intel、AMD、Motorola、Zilog、Toshiba、Hitachi 和 通用 仪 
器 。 然 而 ，AVR (或 者 ,更 精确 地 ，AVR 系 列 ， 因 为 有 基本 AVR 设 计 的 若干 变形 ) 在 其 能 力 
方面 非常 典型 ， 但 是 与 主流 芯片 如 Pentium 或 者 Power 芯 片 (分 别 由 Intel 和 Apple/IBM/ 
Motorola 制 造 ) 在 令 人 关注 的 方面 又 有 所 不 同 。 


9.2 组织 和 体系 结构 


9.2.1 中 央 处 理 单元 

考虑 到 速度 和 简单 性 两 方面 ，Atmel AVR 采 用 RISC 设 计 原则 。 相 对 很 少 的 指令 使 得 指令 
长 度 短 (2 个 字 节 ， 相 比 之 PowerPC 指 令 的 4 个 字 节 ，Pentium 的 指令 多 达 15 个 字 节 ) 并 且 执 行 
速度 快 。 每 条 指令 都 限制 在 16 位 标准 长 度 ， 其 中 包括 必要 的 参量 。 指 令 集 针 对 微 控制 器 通常 
的 需要 而 定 ， 包 括 大 量 用 于 对 单一 电气 信号 操作 的 位 指令 。 尽 管 这 样 ， 仍 然 有 130 条 不 同 的 指 
令 ( 比 JVM 少 )。AVR 的 指令 集 甚 至 也 不 是 最 小 的 ，Microchip 制 造 了 一 个 相对 普通 的 极 小 蕊 
片 一 一 用 在 烤箱 上 一 一 只 有 不 到 35 条 指令 。 

Atmel AVR 包 含 32 个 通用 寄存 器 (编号 从 R0 到 R31) ， 还 有 64 个 IO 寄存 器 。 这 些 寄存 器 每 
个 都 是 8 位 宽 ， 对 于 单一 字 节 或 者 0 一 255 (或 者 -128 一 127) 之 间 的 数 来 说 足 疾 。 如 同 JVM， 
一 些 寄存 器 能 够 成 对 使 用 ， 以 便 允 许 访 问 大 一 点 的 数 。 不 寻常 的 是 〈 至 少 与 我 们 已 经 学 过 的 
计算 机 相 比 )， 这 些 寄存 器 是 物理 存储 器 的 一 部 分 ， 而 没有 与 存储 器 芯片 分 离 (如 图 9-1 所 示 )。 
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FLASH 存 储 体 
(代码 存储 ) 


SRAM 体 
(短期 数据 存储 ) 


| sRAM oo0l | 
EEPROM 体 
(长 期 数据 存储 ) 


图 9-1 AVR 体 系 结构 图 。 特 别 注意 哈佛 体系 结构 (多 个 分 离 的 存储 块 ) 
以 及 不 是 在 CPU 中 而 是 在 存储 器 中 保存 的 通用 寄存 器 


考虑 所 有 的 实际 用 途 ，AVR 不 支持 浮 点 数 ，ALU 只 对 整 型 进行 操作 ， 并 且 是 非常 小 的 
整数 。 

从 操作 上 ，AVR 与 我 们 已 经 了 解 的 计算 机 非常 相似 ， 有 专用 指令 寄存 器 、PC、 栈 指针 ， 
等 等 。 


9.2.2 存储 器 

因为 AVR 是 微 控 制 器 ， 所 以 AVR 上 的 存储 器 是 非常 受 限 的 。 与 以 往 不 同 ，AVR 的 存储 器 
被 分 成 3 个 独立 存储 体 ， 这 3 个 存储 体 不 仅 在 物理 特性 上 不 同 ， 而 且 在 大 小 和 容量 方面 也 不 同 。 
确切 的 存储 器 容量 依 型 号 的 不 同 而 不 同 ， 但 是 AT90S2313 的 容量 很 有 代表 性 。 这 个 机 器 ， 如 
同 多 数 微 控 制 器 ， 是 哈佛 体系 结构 设计 的 范例 ， 这 里 分 开 的 存储 体 ( 和 分 开 的 数据 总 线 ) 可 
以 用 于 机 器 指令 和 数据 。 借 助 两 个 不 同 路 径 ， 每 个 存储 体 都 能 独立 地 调整 发 挥 其 最 大 性 能 。 
更 进一步 ， 计 算 机 能 同时 载 和 人 指令 和 数据 (通过 两 组 总 线 ) ， 有 效 地 加 倍 其 速度 。 但 是 对 于 通 
用 计算 机 ， 一 般 也 要 求 两 个 分 开 的 cache 存 储 器 (一 个 用 于 指令 ， 一 个 用 于 数据 )， 这 反 过 来 
减少 了 每 个 存储 器 可 用 的 cache 容 量 ， 于 是 严重 地 损害 了 cache 的 性 能 。 在 微 控 制 器 上 ， 存 储 器 
就 是 全 部 的 cache， 不 存在 上 述 影响 。 

在 AVR 中 ， 有 三 种 分 开 的 存储 体 : 一 个 用 于 程序 代码 的 只 读 存储 体 (因为 程序 代码 在 程 
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序 执行 过 程 中 不 应 该 被 改变 ) ， 一 个 用 于 程序 变量 的 高 速 可 读 / 写 存储 体 ， 第 三 个 存储 体 用 于 
长 期 保存 程序 数据 ， 这 些 数据 必须 在 断 电 时 还 能 够 保持 〈 例 如， 日 志 或 者 配置 信息 ) 。 不 像 伟 
统 的 体系 结构 ， 所 有 存储 器 基本 上 是 相同 的 并 且 以 单一 虚拟 地 址 空间 来 满足 任何 访问 ，AVR 
三 个 存储 体 中 的 每 一 个 都 是 独立 组 织 并 且 用 它们 自己 的 地 址 空间 和 指令 来 访问 。 

正如 前 面 讨论 的 ，ROM (只 读 存储 器 ) 和 RAM (随机 访问 存储 器 ) 之 间 存在 一 个 根本 的 
区 别 ， 可 以 从 ROM 中 读 ， 但 是 不 能 向 ROM 中 写 ， 而 RAM 既 可 读 又 可 写 。 这 个 区 别 在 理论 上 
比 实际 上 更 重要 ， 随 着 多 种 类 型 存储 器 的 发 展 ， 要 求 大 量 设备 可 涂写 (一 种 抽象 的 、 柏 拉 图 
的 、 兄 贵 的 意识 ) 。 实 际 上 ，ROM/ARAM 区 别 的 现代 定义 是 使 用 上 的 不 同 ， 无 论 CPU 能 否 写 人 
存储 体 。 在 AVR 中 ， 第 一 个 存储 体 由 FLASH ROM 构 成 。 尽 管 FLASH 在 理论 上 是 读 / 写 存 储 器 
( 它 是 通常 用 作 移 动 驱动 盘 的 存储 器 ) ， 但 是 AVR 中 没有 向 其 写 和 的 电路 和 指令 。 从 AVR 的 角 
度 ，FLASH 存 储 器 提供 (在 AT90S2313 上 ，2048 字 节 ) 非 挥发 存储 ， 断 电 时 也 不 丢失 信息 。 
该 存储 器 ， 用 于 所 有 只 读 用 途 ， 以 16 位 字 方 式 组 织 ， 保 存 可 执行 的 机 器 代码 。 特 别 地 ，PC 中 
保存 的 值 就 是 用 作 指向 该 存储 块 的 字 地 址 。AVR 芯 片 自身 不 能 对 ROM 进 行 任何 改变 ，ROM 只 
能 由 人 们 借助 合适 的 外 部 设备 (说 实话 ， 设 备 并 不 贵 ) 对 其 重新 编程 。 

相 比 之 下 ， 第 二 个 存储 体 既 可 读 又 可 写 。 这 个 数据 存储 器 由 SRAM (静态 随机 访问 存储 
器 ) 构成 。 正 如 补充 资料 中 讨论 的 ，SRAM 和 DRAM (动态 随机 访问 存储 器 ) 之 间 的 主要 区 
别 是 动态 RAM 要 求 计算 机 电路 给 出 周期 性 的 “刷新 ”信号 以 便 保持 所 存 的 值 。AT90S2313 的 
SRAM 容 量 为 256 字 节 。 

既然 存储 器 基本 上 是 由 最 快 数据 存储 电路 构成 ， 就 不 再 需要 单独 的 高 速 寄存 器 体 ， 如 典 
型 计算 机 中 的 寄存 器 。AVR 数 据 存储 器 组 织 成 一 个 8 位 字 节 序列 ， 分 成 三 个 子 体 。 前 32 字 节 / 
字 (0x00..0x1F， 或 者 使 用 Atmel 记 法 为 $00..$1F) 用 来 作 通 用 寄存 器 R0..R31。 接 下 来 的 64 个 
字 (0x20..0x5F) 用 来 作 64 个 IO 寄存 器 ， 其 余 的 SRAM 提 供 一 组 通用 的 存储 器 储存 单元 ， 用 
于 记录 程序 变量 和 /或 栈 帧 。 这 些 存储 器 储存 单元 使 用 从 0x60 开 始 直到 SRAM 的 最 高 地 址 进行 
访问 (AT9%0S2313 SRAM 的 最 高 地 址 是 0xDF)。 

最 后 ， 第 三 个 存储 体 使 用 另 一 类 存储 器 ，EEPROM。 如 同 FLASH ROM，EEPROM 是 非 
挥发 的 ， 所 以 关闭 电源 后 数据 也 一 直 保存 。 与 SRAM 类 似 ，EEPROM 是 电 可 编程 的 ， 因 此 
AVR CPU 能 向 EEPROM 写 数据 ， 并 且 数 据 能 够 永久 保存 (尽管 这 需要 很 长 时 间 ， 以 4ms 的 数 
量 级 ) 。 与 SRAM 不 同 的 是 ， 数 据 被 写 人 的 次 数 有 限 (大 约 100 000 次 ， 尽 管 技术 一 直 在 改进 )。 
这 是 存储 器 构造 的 物理 问题 ， 编 写 AVR 程 序 时 应 该 记 住 这 一 点 。 每 秒 向 EEPROM 存储 体 只 写 
一 条 数据 并 且 只 写 一 次 ， 一 天 多 一 点 的 时 间 就 会 达到 100 1000 次 的 写 限制 。 然 而 ， 计 算 机 能 
够 从 EEPROM 安全 地 读 ， 并 且 没有 读 的 次 数 限制 。 这 使 得 EEPROM 是 理想 的 保存 现场 可 修改 
数据 的 存储 体 ， 这 里 的 数据 需要 保存 但 是 不 用 经 常 修改 ， 例 如 启动 /配置 信息 或 者 不 频繁 的 数 
据 日 志 (比如 ， 每 小 时 一 次 ， 这 样 能 记录 大 约 10 年 )。 在 我 们 的 例子 中 ，EEPROM 存 储 体 容量 
为 128 字 节 。 

这 些 存储 体 每 个 都 有 其 自己 的 地 址 空间 ， 因 此 数字 0 (0x00) 不 仅 能 指 实际 的 0 也 能 指 
FLASH 存 储 器 的 最 低 2 个 字 节 ，EEPROM 的 最 低 (单个 ) 字 节 ， 或 者 SRAM 的 最 低 字 节 ( 即 
R0) 。 与 所 有 的 汇编 语言 程序 一 样 ， 解 决 这 个 二 义 性 的 关键 是 上 下 文 ，PC 中 保存 的 值 指向 
FLASH 存 储 器 ， 而 普通 寄存 器 的 值 ( 当 被 读 作 地 址 时 ) 指向 SRAM 中 的 单元 。 对 EEPROM 的 
访问 通过 专用 硬件 ， 实 际 上 可 将 EEPROM 视 为 外 设 。 
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补充 资料 
存储 器 类 型 

玫瑰 到 底 还 是 玫瑰 ， 但 是 存储 器 不 只 是 存储 器 。 我 们 已 经 讨论 了 几 种 不 同 的 存储 器 一 一 
例如 ，RAM 和 ROM 之 间 的 不 同 。 广 义 讲 ， 工 程 师 们 总 是 讨论 不 同 种 类 的 存储 器 ， 每 一 种 
都 有 其 适应 的 用 途 。 

。RAM: 随机 访问 存储 器 。 这 是 最 常用 的 存储 器 类 型 ， 人 们 上 听 到 存储 器 时 就 会 想到 

的 ， 二 进 制 值 被 当成 电信 和 号 保存 。 每 组 信号 集合 (通常 集合 是 字 或 字 节 尺 寸 ， 也 可 
以 是 单独 的 位 ) 可 以 “随机 ”的 次 序 被 独立 地 访问 ， 因 此 得 名 。RAM 是 一 种 挥发 性 
存储 器 ， 它 需要 电源 来 保持 信号 ， 如 果断 电 ，RAM 中 所 有 的 信息 都 会 消失 。 

RAM 又 分 为 两 种 类 型 : 动态 RAM (DRAM) 和 静态 RAM (SRAM)。 你 购买 或 者 看 
到 的 大 多 数 存储 器 是 DRAM， 它 比较 便宜 并 且 小 巧 。 每 个 “位 ”保存 的 只 不 过 是 一 个 电容 
中 的 电荷 ( 另 有 一 个 相关 的 晶体 管 )， 电 容 在 短 时 内 保持 能 量 。DRAM 的 问题 在 于 存储 器 
电路 内 部 的 电荷 衰退 ， 即 使 臣 片 本 身 有 电源 。 只 要 计算 机 有 电 SRAM 就 会 记 住 保存 的 值 而 
不 需 刷 新 。 实 际 上 ， 这 意味 着 计算 机 必须 周期 地 产生 刷新 信号 来 重建 DRAM 存 储 模 式 。 
( "周期 地 ”在 这 个 上 下 文中 意味 每 秒 儿 千 次 。 这 对 于 1GHz 的 处 理 器 来 说 仍然 是 一 个 相当 
长 的 时 间 间 隔 。) 

与 之 相 比 ，SRAM 是 自 增强 的 ， 像 附录 A 中 讨论 的 触发 器 电路 。 每 个 存储 位 的 建立 一 
般 需 要 6 一 10 个 晶体 管 ， 这 意味 着 一 个 字 节 的 SRAM 存 储 在 茧 片上 要 占用 大 约 10 倍 的 空间 ， 
并 且 成 本 也 高 达 10 倍 。 另 一 方面 ，SRAM 不 需要 刷新 周期 ， 所 以 它 可 更 快 地 访问 。DRAM 
通常 用 来 做 主 存储 器 (这 里 几 百 兆 字 节 的 额外 成 本 会 累加 )， 而 SRAM 一 般 用 于 小 型 、 速 
度 关 键 的 存储 应 用 ， 如 计算 机 的 cache 存 储 器 。( 出 于 这 个 理由 ，Atmel 微 控制 颖 只 用 
SRAM 做 它 的 可 写 存 储 品 ， 还 不 到 1000 字 节 ， 速 度 因 素 超 过 了 价格 因素 。) 尽管 SRAM 是 
自 刷新 的 ， 出 体 管 也 需要 电源 才能 工作 ， 如 果 电 源 被 切断 时 间 过 长 (以 毫秒 计 ) SRAM 的 
信和 号 就 会 丢失 。 因 此 ，SRAM 仍 被 认为 是 挥发 性 存储 器 。 

。ROM:， 只 读 存 储 器 。RAM 既 能 够 读 出 也 能 够 写 入 ， 而 ROM 芯 片 不 能 被 写 入 。 更 准 

确 的 描述 是 必须 要 写 入 ROOM 芯片 时 ， 需 要 特殊 的 操作 ， 有 时 甚至 是 特殊 的 设备 。 然 

而 ，ROM 的 优势 在 于 它 是 一 种 非 挥 发 存储 器 ,意味 着 如 果 从 芯片 断 电 ， 数 据 仍 能 保 

持 。 这 使 得 它 成 为 理想 的 存储 器 ， 例 如 ， 存 储 数码 相机 拍摄 的 照片 。 

ROM 最 简单 又 古老 的 组 织 方式 类 似 于 DRAM， 但 是 不 使 用 电容 ， 每 个 存储 单元 包含 一 
个 二 极 管 ， 由 芯片 厂商 对 其 进行 编程 ， 仅 当 存 储 单元 包 食 1 时 才 允 许 电流 通过 。 由 于 二 极 管 
不 需要 电源 ， 而 且 一 般 不 会 消 亿 ， 构 建 在 芯片 中 的 模式 永远 保持 不 变 ， 除 非 你 踩踏 或 诸如 此 
类 的 破坏 。 另 外 ， 厂 商 必须 确切 地 知道 要 用 的 存储 值 是 什么 ， 如 果 厂 商 改 变 了 决定 或 者 出 了 
差错 ， 后 果 是 非常 严重 的 。(1993 年 Pentium fdiv 浮 点 除 bug 就 是 ROM 出 错 的 一 个 示例 。) 

可 以 非常 廉价 地 大 量 生产 ROM 每 个 芯片 儿 美 分 。 但 是 ， 如 果 你 只 需要 25 个 芯片 
会 怎样 呢 ? 为 此 可 能 就 不 值得 收买 整个 芯片 制造 厂 。 取 而 代 之 ,使 用 PROM (可 编程 的 
ROM) 芯片 会 更 好 。 像 ROM 芯 片 一 样 ，PROM 是 通过 对 每 个 存储 单元 (不 是 主动 元 件 ， 
如 晶体 管 ) 静态 电 连 接 而 成 。 在 PROM 中 这 些 连 接 实 际 上 是 融 丝 ， 通 过 施加 足够 高 的 电压 
可 以 将 融 丝 熔断 。 这 个 过 程 被 形象 化 地 称 为 “ 烧 制 ”PROM。PROM 一 旦 被 烧 制 ， 保 持 的 
电气 连接 (或 者 是 断 开 ) 就 始终 固定 不 变 了 。 因 为 不 可 能 再 您 合 融 丝 ， 所 以 PROM 只 能 被 
烧 制 一 次 。 
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ROM 最 后 一 种 形式 避免 了 这 个 问题 。EPROM (可 擦 写 可 编程 ROM) 芯片 对 于 存储 元 
采用 先进 的 量子 物理 创立 基于 半导体 的 可 重用 融 丝 。 为 了 建立 一 个 电气 连接 ， 存 储 单元 也 
要 像 PROM 一 样 接受 过 电压 。 然 而 ， 应 用 紫外 线 光 照 儿 分 钟 之 后 , “ 融 丝 ”就 会 复原 。 这 
将 擦 除 整 个 芯片 ， 允 许 重新 编程 以 及 重新 使 用 。 

* 混合 存储 器 经 过 获取 两 方面 最 佳 性 能 的 努力 ， 制 造 商 已 经 开始 生产 所 谓 的 混合 存储 

器 ， 混 合 存储 器 是 电场 可 编程 的 ， 同 时 还 具有 ROM 的 存储 优势 。EPROM 技 术 的 一 
个 变形 ， 如 EEPROM ( 电 可 擦 除 可 编程 ROM) 芯片 ， 使 用 本 地 电场 “ 擦 除 ” 每 一 个 
存储 单元 而 不 是 作为 一 个 整体 将 牙 片 全 部 擦 除 。 由 于 这 个 操作 是 通过 电子 手段 执行 
的 ，EEPROM 不 需要 紫外 光 箱 ， 是 个 独立 部 分 。 

另 一 方面 ， 写 EEPROM 要 花 很 长 时 间 ， 因 为 存储 单元 必须 暴露 在 磁场 下 擦 除 ， 这 要 花 
费 若 干 毫秒 。 在 理论 上 ，EEPROM 与 RAM 提 供 同样 的 功能 ， 因 为 每 个 存储 单元 都 可 以 写 、 
读 以 及 改写 ， 但 是 计时 (以 及 成 本 问题 ) 使 它 并 不 实用 。EEPROM 的 主要 问题 在 于 它们 
一 般 只 有 有 限 数 量 的 读 / 写 周期 。 

FLASH 存 储 是 加 速写 入 EEPROM 过 程 的 一 种 方法 。 其 基本 思想 很 简单 ， 电 场 不 是 单 
独 擦 除 每 个 位 ， 而 是 擦 除 芯 片 的 大 岂 。 擦 除 一 个 块 与 擦 除 单个 位 的 用 时 几乎 相同 ， 但 是 在 
必须 大 量 保存 数据 时 (比如 ， 在 一 个 笔 驱 动 上 ， 像 我 钟爱 的 Jump Drive 2.0 Pro， 由 Lexar 
Media 制 造 )， 向 存储 器 传输 一 个 数据 块 的 时 间 超 过 了 擦 写 所 放置 区 域 的 时 间 。FLASH 存 
储 器 已 被 广泛 地 使 用 ， 不 仅 用 于 笔 驱 动 ， 也 用 做 数码 相机 存储 器 、 智 能 卡 、 游 戏 控制 台 存 
储 卡 以 及 PCIMCIA 卡 内 的 固态 盘 。 

混合 存储 器 的 曙 外 一 个 变形 是 NVRAM ( 非 挥发 RAM) ，NVRAM 实 际 上 是 携带 电池 
的 SRAM。 当 电源 断 开 时 ， 电 池 能 够 供电 使 得 SRAM 苹 片 中 的 存储 单元 保持 通电 。 当 然 ， 
电池 的 成 本 使 得 这 种 存储 器 比 简单 的 SRAM 要 贵 得 多 。 

。SAM (顺序 访问 存储 器 ) : 不 提 到 SAM， 对 存储 器 类 型 的 讨论 就 是 不 完全 的 。 直 党 

上 任何 曾经 要 在 录影 带 上 找 出 茶 个 情景 的 人 都 会 熟悉 SAM。 与 RAM 不 同 ，SAM 只 
能 以 特定 (顺序) 的 次 序 访问 ， 这 使 得 小 数据 量 的 使 用 慢 得 可 怕 。 多 种 辅 存 
CD-ROM、DVD、 硬 盘 ， 特 别 是 磁带 一 一 实际 上 都 是 SAM 设 备 ， 尽 管 它们 一 般 提供 
块 级 的 随机 访问 。 





9.2.3 ”设备 和 外 设 

AVR 实 现 了 一 种 简单 的 存储 器 -LO 映像。 这 一 设计 并 不 是 面向 图 形 量 大 的 环境 ， 在 那里 人 
们 也 许 期 待 以 每 秒 多 达 20 至 30 次 的 速度 显示 由 上 百 万 字 节 组 成 的 画面 。 取 而 代 之 ， 它 只 求 驱 
动 一 个 芯片 ， 而 这 个 忆 片 的 输出 通过 几 个 引 脚 物理 地 〈 而 且 电气 地 ) 附加 到 CPU 电 路 。 具 体 
地 ， 这 些 引 脚 是 可 寻 址 的 ， 通 过 IO 存储 体 中 特别 定义 的 单元 对 其 进行 录 址 。 例 如 ， 写 人 IO 存 
储 单元 0x18 (SRAM 存 储 单元 0x38) 被 定义 成 写 人 “端口 B 数 据 寄存 器 ”(PORITB ) ， 这 等 价 
于 端口 B 第 八 个 输出 引 脚 设置 一 个 电气 信号 。 这 个 芯片 有 足够 的 能 源 点 亮 一 个 简单 的 发 光 二 极 
管 (LED) ， 或 者 启动 一 个 电气 开关 来 接 遂 高 压 电 源 给 更 多 的 用 电 设备 供电 。 类 似 地 ， 读 取 寄 
存 器 不 同 的 位 能 使 CPU 检测 引 脚 当 前 的 电压 ， 或 者 检测 一 个 光电 池 是 否 对 光 有 反应 ， 或 者 判 
定 从 外 部 传感器 读 来 的 当前 温度 。 

AVR 提 供 若干 双向 数据 端口 ， 这 些 端口 能 被 单独 地 定义 〈 基 于 每 个 引 脚 ) 成 输入 或 输出 
设备 。AVR 也 提供 片上 计时 电路 ， 可 以 用 来 测量 经 过 的 时 间 和 /或 让 站 片 对 有 规律 的 循环 发 生 
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的 行为 采取 措施 (如 每 30 秒 改变 红绿灯 或 每 毫秒 读 一 次 发 动机 的 温度 ) 。 取 决 于 型 号 ， 会 有 一 
些 伐 人 的 外 设 如 用 于 大 规模 数据 发 送 /接收 的 UART (通用 异步 收发 器 )， 用 来 比较 两 个 模拟 传 
感 器 读数 的 模拟 比较 器 等 。 与 大 型 计算 机 不 同 ， 许 多 输出 〈 引 脚 ) 由 儿 个 不 同 的 输出 设备 共 
享 ， 用 于 UART 的 引 脚 与 用 于 数据 端口 B 的 引 脚 在 物理 上 是 相同 的 。 没 有 这 种 重 倒 ， 芯 片 在 物 
理 上 将 会 非常 难 用 (有 上 百 个 引 脚 需要 单独 地 连接 )， 但 是 重叠 本 身 意味 着 几 个 设备 不 能 同时 
使 用 。 如 果 你 正在 使 用 端口 B ， 你 就 不 能 同时 使 用 UART。 

IO 存储 器 也 是 CPU 本 身 当 前 状态 信息 的 保存 场所 。 例 如 ，AVR 状 态 寄存 器 (SREG) 位 
于 I/O 单 元 0x3F (SRAM 地 址 0x5F) ， 并 且 包 含 描述 CPU 当前 状态 位 〈 如 最 近 计 算 结 果 是 否 
为 0， 或 者 负数 ) 。 栈 指针 保存 在 单元 0x3D (0x5D) 并 且 定 义 该 单元 (在 SRAM 内 ) 为 活动 
栈 单 元 。 由 于 这 些 寄存 器 在 编程 上 被 当成 存储 单元 来 对 待 ， 与 WO 外 设 打 交道 就 如 同 读 写 在 
储 单元 一 样 。 


9.3 ”汇编 语言 


像 多 数 芯 片 一 样 ，AVR 中 的 寄存 器 没有 任何 特别 的 组 织 方 式 。 汇 编 语 言 指令 用 两 参量 格 
式 编 写 ， 目 的 操作 数 曾 是 一 个 源 操 作 数 。 因 此 

ADD R@, R1 ;RO = RO + RIL 

将 R1 的 值 加 到 R0 中 ， 结 果 在 RO 中 保存 ， 置 位 SREG 反 映 运 算 结果 。 令 人 迷惑 的 是 ， 数 字 0 
和 数字 1 与 更 易 理解 的 RO 和 R1 有 同样 的 作用 一 一 汇编 器 对 两 者 都 能 接受 。 尽 管 表面 上 这 非常 
像 一 条 Pentium 或 Power 的 汇编 语言 指令 ,但 它 (当然 ) 符合 一 个 不 同 的 针对 Atmel AVR 的 机 
器 语言 标准 。 

AVR 提 供 了 我 们 希望 的 大 部 分 普通 的 算术 和 逻辑 类 指令 ; ADD、SUB、MUL (元 符号 乘 )、 
MULS 〈 有 符号 乘 )、INC、DEC、AND、0R、COM ( 按 位 求 反 ， 即 NOT) 、NMEG (〈 补 码 ) 、EOR ( 蜡 或 )， 
以 及 TST (测试 寄存 器 的 值 ， 如 果 该 值 为 0 或 者 是 负数 则 设置 相应 的 位 ) 。 也 许 我 们 会 觉得 奇怪 ， 
它 不 提供 慢 速 昂贵 的 除法 操作 。 取 模 操作 也 没有 ， 而 且 不 支持 浮 点 。 

为 了 加 速 微 控 制 器 完成 典型 计算 的 速度 ， 有 一 些 一 I 变形 指令 (SUBI、0RI、AN0I 等 等 )， 
它们 采用 立即 方式 常数 并 且 对 寄存 器 进行 操作 。 例 如 ， 

ADD 0, 1 ; RO = RO + R1 

寄存 器 1 与 寄存 器 0 相 加 。 指 令 

ADDI 0, 1 ;RO0 = RO+1， 或 者 R0 增 1 

将 立即 值 1 与 寄存 器 0 相 加 。 

也 有 一 些 指令 执行 单独 的 位 操作 : 如 ，SBR (设置 寄存 器 中 的 位 ) 或 者 CBI (清除 IO 寄存 
器 中 的 位 ) 将 设置 /清除 一 个 通用 寄存 器 或 者 IO 寄存 器 中 的 位 。 例 如 ， 

SBR RO ， FF ; RG = RO OR 0xFF 
将 设置 寄存 器 0 的 低 8 位 为 全 1。 

控制 操作 也 很 多 。 除 了 转移 / 跳 转 指令 (无条件: JMP ， 有 条 件 : BR??， 这 里 ?? 指 不 同 的 
标志 以 及 SREG 中 的 标志 组 合 ， 以 及 跳 转 到 子 程序 : CALL) ， 还 有 一 些 新 的 操作 。S8?? 操 
作 一 一 第 一 个 ?可 以 是 R (通用 寄存 器 ) 或 1 (IO 寄存 器 ) ， 第 二 个 ?可 以 是 5 (清除 位 ) 或 5 
( 置 位 ) ， 因 此 SBIC= 如 果 LIO 寄 存 器 中 的 位 清除 就 号 过 下 条 指令 一 一 执行 一 个 非常 有 限 的 条 件 
转移 ， 如 果 相 应 寄存 器 的 位 被 设置 /清除 就 跳 过 邻近 的 下 一 条 指令 。AVR 也 支持 间接 跳 转 (无 
条 件 : IJMP ， 对 于 子 程序 ， ICALL) 这 里 的 目标 位 置 取 自 寄 存 器 (对 )， 具 体 是 保存 在 
R30:R31 中 的 16 位 值 。 
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9.4 ”存储 器 组 织 和 使 用 


一 般 的 数据 传送 指令 缺 省 对 SRAM 存 储 体 进行 操作 。 由 于 寄存 器 和 IO 寄存 器 都 是 这 个 存 
储 体 的 一 部 分 ， 所 以 向 寄存 器 写 人 和 向 一 个 简单 的 SRAM 字 节 写 人 并 没有 区 别 。 然 而 ， 前 面 
一 节 中 定义 的 算术 操作 只 与 通用 寄存 器 (R0.R31) 打交道 ， 所 以 就 必须 准备 着 在 这 个 存储 体 
内 来 回 地 移动 数据 了 。 通 常用 于 此 目的 的 指令 是 LDS (从 SRAM 直 接 载 人 ) ， 该 指令 第 一 个 参 
量 是 寄存 器 ， 第 二 个 参量 是 存储 单元 ， 或 与 LDS 相 对 的 SDS (直接 存 人 SDRAM)，SDS 的 参量 
及 处 理 都 与 LDS 相 反 。AVR 还 提供 3 个 特别 的 间接 地 址 寄存 器 ，X、Y 和 Z， 可 用 于 间接 寻 址 。 
这 些 是 最 后 6 个 寄存 器 ， 成 对 使 用 (所 以 X 寄 存 器 实际 是 R26:R27 对 ) ， 用 来 保存 存储 器 地 址 。 
使 用 这 些 寄 存 器 和 LD (直接 载 和 人 ) 指令 ,代码 


CLR R26 ; 清除 R26 (将 其 设置 为 0) 
LDI R27，8x5F ; 给 R27 裁 人 立即 值 (常数 值 ) 5F 
LD RO, X 将 (X) [=5F 单 元 中 的 值 ] 移 入 RO 


将 存储 单元 0x005F 中 的 值 指 人 寄存 器 0 中 它 首 先 将 X 寄 存 器 的 两 个 部 分 单独 设置 为 0x00 
和 0x5F， 然 后 将 XX 用 作 索 引 寄 存 器 (我 们 前 面 已 经 知道 0x5F 实 际 上 是 SREG 寄 存 器 )。 做 这 件 
事 更 简单 的 方式 是 使 用 IN 指令 ， 该 指令 从 指定 的 IO 寄存 器 读 取 数 值 ; 

IN R@, Ox3F ;拷贝 SREG 至 R0 

注意 ， 尽 管 SREG 在 存储 单元 0x5F， 它 只 在 VO 端口 3F。 

使 用 LPM (从 程序 存储 器 载 人 ) 指令 能 间接 地 访问 FLASH 存 储 器 (只 能 读 出 不 能 写 入 )。 
寄存 器 Z 中 的 值 用 作 存 储 器 地 址 ， 指 向 程序 (Flash) 存储 区 ， 相 应 的 值 被 找 入 R0 寄 存 器 。 

访问 EEPROM 要 难得 多 ， 主 要 由 于 物理 和 电子 的 原因 。 尽 管 EEPROM 存 储 体 在 理论 上 可 
读 / 写 ,但 是 写 入 会 造成 对 存储 体 的 物理 改变 。 因 此 ， 需 要 花 很 长 时 间 完 成 ， 并 且 需 要 大 量 的 
前 期 准备 ( 尤 如 发 动 “ 电 泵 ”以 提供 必要 的 能 源 进行 存储 体内 容 更 改 ) ， 这 些 准 备 工作 需要 在 
写 操作 之 前 进行 。AVR 设 计 者 选择 更 接近 于 类 似 访问 设备 的 存储 器 访问 模式 。 

AVR 定 义 了 3 个 IO 寄存 器 (SRAM 中 LO 寄存 器 体 的 一 部 分 ) : EEAR (EEPROM 地 址 寄存 器 ) ， 
EEDR (EEPROM 数据 寄存 器 ) 和 EECR (EEPROM 控制 寄存 器 ) 。EEAR 包 含 一 个 与 访问 地 址 
一 致 的 位 模式 〈 在 我 们 的 标准 示例 中 ， 该 值 在 0 到 127 之 间 ， 所 以 最 高 位 应 该 总 是 0)。EEDR 包 
含 要 写 入 的 数据 或 者 是 已 读 出 的 数据 ， 无 论 哪 种 情况 都 用 EEAR 中 的 数据 作为 目的 地 址 。 

EECR 包 含 3 个 控制 位 ， 这 些 位 单独 地 启用 对 EEPROM 存储 体 的 读 或 写 访 问 。 特 别 地 ， 
EECR 的 位 0 (最 低 有 效 位 ) 被 定义 为 EERE (EEPROM 读 启 用 ) 位 。 要 从 EEPROM 给 定位 置 
读 ， 程 序 员 应 该 采取 以 下 步 又 ; 

。 将 要 访问 的 字 节 地 址 载 人 EEAR。 

。 设 置 EERE 为 1， 人 允许 读 。 

。 读 出 数据 。 

。 读 操作 完成 后 ， 在 EEDR 中 找 出 所 需 数据 。 

写 入 的 步骤 有 些 复 杂 ， 因 为 有 两 个 启用 位 需要 设置 。 位 2 被 定义 为 EEMWE (EEPROM 主 
写 启用 ) 位 ， 当 该 位 被 置 成 1 时 ，CPU 人 允许 向 EEPROM 写 人 。 然 而 ， 这 实际 上 并 没有 进行 写 ， 
这 只 是 做 了 写 的 前 期 准备 。 真 正 的 写 是 在 EEMWE 已 经 被 置 为 1， 然 后 通过 将 位 1 
(EEWE/EEPROM 写 启用 位 ) 置 为 1 之 后 才 开 始 的 。 经 过 一 段 短 时 ( 约 四 条 指令 的 执行 时 间 ) 
之 后 ，EEMWE 将 自动 返回 90。 这 个 两 阶段 提交 任务 的 过 程 能 防止 计算 机 在 程序 出 现 bug 时 意外 
地 改写 EEPROM (破坏 重要 的 数据 )。 

为 了 向 EEPROM 写 入 ， 程 序 员 应 该 
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。 将 要 访问 的 字 节 地 址 载 人 EEAR 。 

。 将 新 数据 载 和 信 EEDR.。 

。 设 置 EEMWE 为 1， 人 允许 向 EEPROM 存储 体 写 人 。 

。 (四 个 时 钟 周期 之 内 ) 设置 EEWE 为 1， 人 允许 写 和 人 开始 。 

。 写 人 数据 。 

然而 ， 实 际 写 人 可 能 会 相当 地 慢 ， 要 花 大 约 4ms 的 时 间 。 对 于 一 个 以 10MHz 运 行 的 芯片 而 
言 ， 这 段 时 间 足 以 执行 40 000 (! ) 个 其 他 操作 。 由 于 这 个 原因 ， 最 好 不 要 将 EEPROM 写 放 
在 中 间 ( 即 一 个 可 能 的 当前 写 完成 之 后 等 待 EEWE 位 变 为 0) ， 在 EEPROM 操作 之 前 ， 把 能 做 
的 都 做 完 。 


9.5 接口 问题 


9.5.1 与 外 部 设备 的 接口 

前 面 描述 的 EEPROM 接口 与 其 他 外 设 接口 非常 相像 。 每 个 设备 都 由 IO 寄存 器 体内 定义 的 
寄存 器 控制 。 几 个 例子 就 足以 表明 这 种 交互 。 

AT90S2313 提 供 了 一 个 作为 修 人 设备 的 UART 来 驱动 标准 串口 。 我 们 将 忽略 电气 连接 的 物 
理 细 节 ， 虽 然 这 很 有 趣 ， 但 是 它 将 把 我 们 带 到 电气 工程 的 领域 ， 而 不 是 计算 机 体系 结构 。 
CPU 与 UART 通 过 4 个 寄存 器 进行 硬件 交互 ; UART 1/O 数 据 寄存 器 (保存 要 被 发 送 或 者 已 经 接 
收 的 数据 )、UART 控 制 寄 存 器 (控制 UART 的 实际 操作 ， 例 如 ， 启 用 发 送 ， 或 者 设置 操作 参 
数 )、UART 波 特 率 寄存 器 (控制 数据 传输 的 快 / 慢 )， 以 及 UART 状 态 寄 存 器 (显示 UART 当 前 
状态 的 只 读 寄存 器 ) 。 要 通过 UART 以 及 串 行 线路 发 送 数据 ， 首 先 将 要 发 送 的 数据 载 人 到 
UART LO 数据 寄存 器 ， 然 后 将 所 需 速率 的 表示 模式 载 人 到 UART 波 特 率 寄存 器 。 为 了 执行 数 
据 传送 ，UART 控 制 寄 存 器 一 定 要 被 设置 成 “发 送 启用 ”( 严 格 地 说 ， 就 是 UART 控 制 寄 存 器 
的 位 3 一 定 要 被 置 成 1) 。 如 果 在 发 送 的 过 程 中 出 现 错误 ，UART 状 态 寄 存 器 的 相应 位 就 会 被 置 
位 ， 而 计算 机 能 够 观察 到 ， 并 且 采 取 适 当 的 校正 措施 。 

与 数据 端口 的 交互 涉及 类 似 的 过 程 。 与 UART 不 同 ， 数 据 端口 可 配置 成 允许 多 达 8 个 独立 
的 电气 信号 同时 传输 。 使 用 该 系统 ， 单 一 数据 端口 就 能 同时 监视 3 个 按钮 〈 作 为 输入 设备 ) 和 
一 个 开关 〈 作 为 输入 设备 ) ， 还 能 控制 4 个 输出 LED 。 每 个 数据 端口 由 两 个 寄存 器 控制 ， 一 个 
(数据 方向 寄存 器 ) 用 来 定义 每 个 位 是 控制 设备 输入 还 是 控制 设备 输出 ， 而 另 一 个 〈 数 据 寄 存 
器 ) 保持 相应 的 值 。 要 开启 与 (假如 说 ) 引 脚 6 连接 的 LED ， 程 序 员 首先 应 该 确认 数据 方向 寄 
存 器 的 第 6 位 被 置 1 (配置 该 引 脚 为 输出 设备 ) ， 然 后 设置 数据 寄存 器 的 第 6 位 为 1， 给 该 引 脚 高 
电压 ( 约 3~5 伏 )， 开 启 LED。 通 过 设置 该 引 脚 电压 (接近 ) 至 0 伏 ， 并 且 设 置 这 个 位 为 0， 将 
会 关 掉 LED。 


补充 资料 
了 时钟 、 时 钟 速率 和 定时 
计算 机 怎么 知道 几 点 了 ? 更 重要 地 ， 它 们 怎样 确保 需要 同时 发 生 的 事情 〈 如 寄存 器 中 
所 有 的 位 同时 加 载 ) 确实 能 同时 发 生 ? 一 般 的 回答 都 会 涉及 控制 时 钟 或 者 定时 电路 。 这 不 


过 是 一 个 简单 电路 ， 通 常 挂 上 一 个 晶体 振荡 器 〈 像 数字 钟 里 的 那个 振荡 器 ) 。 这 个 振荡 器 
每 秒 振荡 儿 万 亿 次 ， 每 次 振荡 都 被 捕获 作为 一 个 电信 号 ， 并 被 送 往 所 有 的 电子 器 件 。 技 术 
上 ， 这 就 是 计算 机 描绘 的 1.5GHz 的 来 源 ， 这 个 计算 机 中 主 时 钟 电路 产生 一 个 1.5GHz 频 率 





144 第 二 部 分 冲突 计算 机 





信号 ， 换 名 话 ， 每 秒 振荡 1 500 000 000 次 。 正 如 附录 A 中 所 见 ， 这 个 时 钟 信和 号 允许 进行 所 
需 计 算 ， 防 止 寄生 噪声 引入 错误 。 

对 于 需要 反复 执行 的 动作 ， 如 每 秒 刷新 屏幕 30 次 ， 一 个 受 控 从 电路 只 要 计数 〈 在 此 情 
况 下 ) 50 000 000 主 时 钟 周期 ， 然 后 刷新 屏幕 即 可 。 显 然 ， 那 些 需要 快速 发 生 的 工作 ， 如 
取 指 一 执行 周期 ， 需 要 尽 可 能 短 的 计时 ， 理 想 的 是 以 每 时 钟 周 期 一 次 的 速率 发 生 。UART 
控制 器 的 波 特 率 就 由 类 似 的 受 控 从 电路 控制 。 “速率 模式 ”告诉 这 个 电路 在 UART 必 须 改 
变 信 号 之 前 应 该 发 生 多 少 个 主 时 钟 喃 嘴 。 

这 也 是 超频 工作 的 原理 。 如 果 你 有 一 个 处 理 器 设计 在 1.5GHz 运 行 ， 可 以 调整 主 时 钟 
电路 (也 许 甚至 更 换 振 荡 晶 体 ) 运行 在 2.0GHz。CPU 不 知道 信号 到 达 得 太 快 ， 它 将 努力 
进行 高 速 响应 。 如 果真 正 以 每 个 时 钟 周 期 进行 一 个 取 指 -执行 的 速率 运行 ，CPU 将 尝试 更 
快 地 取 指 令 ， 执 行 。 从 某 种 意义 上 ， 就 像 以 超出 常 速 放 唱 片 一 样 (45 转 /分 而 不 是 30 转 /分 )。 
(可 以 问 问 你 的 父母 。) 有 时 这 样 是 可 行 的 ， 你 能 廉价 地 得 到 30% 速 度 提升 。 另 一 方面 ， 
CPU 也 许 不 能 响应 这 么 快 的 速度 , 它 也 许 就 非常 可 怕 地 停止 了 (例如 ,如果 散热 不 够 充分 )。 
有 时 CPU 会 超越 其 余 的 部 件 (要求 数据 快 传 而 存储 县 已 无 法 满足 它 ， 或 者 总 线 无 法 如 此 快 
的 传输 )。 














9.5.2 与 定时 器 的 接口 

AVR 也 包括 一 些 内 置 定时 器 以 便 处 理 通常 的 任务 ， 如 度量 时 间 ， 或 者 以 规则 间隔 执行 一 
个 操作 。( 想 像 一 个 电梯 : 开门 ， 电 梯 等 待 一 个 固定 的 秒 数 ， 然 后 门 再 关上 。 只 有 1 毫秒 的 开 
门 是 无 用 的 。) 概念 上 ， 这 些 定时 器 非常 简单 :一 个 内 部 寄存 器 设置 为 一 个 初始 值 。 然 后 这 个 
定时 器 统计 时 钟 脉冲 (每 次 给 这 个 内 部 寄存 器 加 1)， 这 个 脉冲 要 么 取 自 内 部 系统 时 钟 ， 要 么 
取 自 外 部 定时 脉冲 源 ， 直 到 内 部 寄存 器 “ 转 了 一 轮 ” 计 数 从 全 1 到 全 0。 此 时 ， 定 时 器 响起 ， 
所 计时 间 已 到 。 

有 一 个 例子 放 在 这 里 很 适合 。 假 设 我 们 有 一 个 时 钟 脉 冲 源 ， 每 2us 来 一 个 脉冲 。 给 一 个 8 
位 定时 计数 器 载 入 一 个 初 值 5， 每 隔 2hs 计 数 器 将 会 增 至 7，8，9，…。 经 过 250 次 这 样 的 增加 
《500us， 大 约 1/2000 秒 ) ， 计 数 器 会 转 到 256， 这 会 溢出 使 寄存 器 为 0。 此 时 ， 定 时 器 向 CPU 发 
出 信号 ， 指 示 时 间 已 到 ， 以 便 CPU 去 做 它 在 等 待 的 事 。 

一 种 常用 并 且 重 要 的 定时 器 就 是 看 门 狗 定 时 器 ， 其 目标 是 防止 系统 死 锁 。 例 如 ， 一 个 写 
得 很 差 的 烤箱 程序 可 能 会 有 bug， 它 可 能 在 加 热 功能 打开 之 后 就 陷入 了 无 限 循 环 。 这 种 无 限 循 
环 的 结果 会 烧 了 你 的 烤箱 ， 很 可 能 还 有 你 的 桌子 、 你 的 厨房 ， 其 至 你 的 公寓 大 楼 。 看 门 狗 是 
一 个 普通 的 定时 器 工作 ， 只 是 它 发 送 给 CPU 的 信号 等 价 于 按 下 重启 按钮 ， 重 新 启动 系统 使 之 
处 于 一 个 已 知 ( 清 醒 ) 状态 。 要 由 程序 负责 周期 性 地 重 置 看 门 狗 ， 以 防止 其 触发 。 

尽管 定时 器 本 身 很 简单 ，CPU 的 行动 就 没有 这 么 简单 了 。CPU 与 定时 器 以 两 种 方式 交互 。 
第 一 ， 旺 方式 ，CPU 把 自己 放 在 一 个 循环 中 ， 轮 询 相应 的 MO 寄存 器 ， 查 看 定时 器 是 否 已 完成 。 
如 果 定 时 器 还 没有 完成 ，CPU 就 返回 循环 的 开始 。 和 遗憾 的 是 ， 这 种 连续 轮 询 (有 了 时 称 为 忙 -等 
待 ) 的 方法 防止 了 CPU 完成 其 他 更 有 用 的 处 理 。 忙 -等 待 过 程 可 以 认为 是 坐 在 话机 旁 等 待 一 个 
重要 电话 而 不 是 把 握 你 的 生活 。 

一 个 更 智能 的 方式 处 理 期 待 的 未 来 事件 (也 适 于 坐等 电话 ) 就 是 建立 一 个 中 断 处 理 器 。 
这 有 些 类 似 AVR 如 何 处 理 期 待 却 不 可 预测 事件 的 方式 。AVR 可 以 辨识 几 种 中 断 ， 这 些 中 断 都 
是 在 硬件 定义 环境 下 产生 的 ， 如 定时 器 溢出 ， 规 定 引 脚 上 的 电气 信号 ， 甚 至 是 开机 。 对 于 
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AVR 而 言 ， 给 定 芯片 的 可 能 中 断 号 从 0 开始 到 一 个 很 小 的 值 (如 10)。 中 断 向 量 内 这 些 编号 与 
FLASH ROM (程序 代码 ) 中 的 单元 相对 应 ， 当 中 断 号 0 出 现时 ，CPU 将 跳 转 到 0x00 单 元 并 且 
执行 存放 在 那里 的 代码 。 中 断 号 1 将 跳 转 到 0x01， 等 等 。 通 常 ， 中 断 单元 内 保存 的 只 是 一 条 
JMP 跳 转 指令 ， 它 将 控制 转移 到 一 个 更 大 的 代码 块 上 ， 这 些 代码 才 是 真正 执行 中 断 任务 的 。 
(特别 地 ， 看 门 狗 定时 器 产生 与 重启 按钮 或 者 加 电 事 件 同 样 的 中 断 ， 由 此 可 以 提供 保护 ， 防 止 
无 限 循 环 和 其 他 程序 pug。) 


9.6 设计 一 个 AVR 程 序 


作为 最 后 一 个 案例 ， 这 里 给 出 一 个 设计 (不 是 全 部 的 代码 )， 展 示 一 个 微 控制 器 程序 在 实 
际 中 是 如 何 工作 的 。 第 一 个 结论 ， 微 控制 器 是 相当 专用 的 计算 机 ， 因 此 存在 很 多 种 程序 ， 以 
至 于 为 微 控制 器 编写 程序 有 些 俐 。AVR 的 物理 组 织 给 出 了 一 些 明 显 的 警示 。 例 如 ， 在 一 个 没 
有 FPU 或 者 浮 点 指令 的 计算 机 上 ， 编 写 涉及 很 多 浮 点 计算 的 程序 是 非常 思春 的 。 然 而 ， 对 于 
其 能 力 范围 内 的 程序 而 言 ，AVR 是 一 个 非常 好 的 芯片 。 

作为 一 个 半 实 际 的 案例 ， 我 们 来 看 一 种 运行 在 微 控制 器 上 的 软件 一 一 具体 地 ， 关 于 一 个 
典型 的 繁忙 交叉 路 口交 通 灯 设计 。 假 设 一 条 北 /南方 向 的 街道 横 穿 一 条 东 / 西 方向 的 街道 ， 城 市 
交通 设计 者 想 要 确认 每 次 只 有 一 条 街道 的 交通 予以 通行 。( 假 设 通常 红 / 黄 / 绿 模式 ， 分 别 意味 
停止 、 注 意 和 通行 。) 

为 了 让 这 个 系统 工作 起 来 ， 提 出 4 个 不 同 的 模式 : 


模式 号 北 / 南 灯 东 / 西 灯 注释 

0 绿 红 北 /南通 行 

1 黄 红 北 / 南 缓慢 通行 
2 红 绿 东 / 西 通行 

3 红 黄 东 / 西 缓慢 通行 


实际 上 ， 这 也 许 不 能 工作 。 出 于 安全 的 考虑 ， 在 交通 从 北 / 南 到 东 / 西 切换 期 间 ， 我 们 也 许 
想 要 设置 所 有 交通 灯 为 红 ， 使 十 字 路 口 空 阅 ， 反 之 亦 然 。 为 防 紧急 情况 出 现 ， 也 需 将 所 有 灯 
置 为 红 灯 。 我 们 可 以 增加 额外 三 种 模式 : 


模式 号 北 / 南 灯 东 / 西 灯 注释 
4 红 红 北 / 南 即将 通行 
5 红 红 东 / 西 即将 通行 
6 红 红 紧急 


这 个 列表 产生 了 另外 两 个 结论 。 第 一 , 程序 必须 做 的 就 是 模式 之 间 的 迁移 (通过 合适 的 定时 )， 
迁移 的 次 序 ， 0，1，5，2，3，4，0，…。 第 二 ， 如 同 许多 其 他 的 微 控 制 器 程序 一 样 ， 这 个 程序 
没有 真正 的 停止 点 。 只 在 这 种 情况 下 ， 程 序 以 无 限 循环 的 方式 运行 不 仅 是 有 用 的 ， 也 是 必须 的 。 

编写 这 类 程序 最 简单 的 方式 是 实现 所 谓 的 状态 机 。 这 个 程序 的 “状态 ”是 代表 交通 灯 显 示 模 
式 的 编号 (如 ， 如 果 状 态 是 4， 所 有 的 交通 灯 应 是 红色 )。 每 个 状态 能 保持 一 定 的 时 长 〈 由 定时 器 
度量 ) 。 当 定时 器 中 断 发 生 时 ， 计 算 机 将 改变 状态 ， 然 后 重新 启动 定时 器 以 便 度量 下 一 段 时 间 。 

在 这 个 状态 表 中 ， 我 们 也 可 使 用 其 他 的 中 断 。 例 如 ， 可 以 加 入 一 个 警察 专用 开关 与 一 个 
引 脚 连接 ， 对 应 一 个 外 部 中 断 。 对 于 这 个 中 断 ， 中 断 处 理 器 将 被 写 人 计算 机 要 进入 的 具体 状 
态 ， 如 所 有 交通 灯 变 红 的 紧急 状态 。 当 那个 开关 被 合 上 时 (由 警察 按 下 按钮 )， 控 制 器 将 立即 
执行 这 个 中 断 。 类 似 地 使 用 外 部 中 断 能 导致 计算 机 检查 是 否 有 行人 按 下 “步行 ”按钮 ， 和 致使 
计算 机 迁移 到 另外 一 个 状态 ， 此 时 相应 的 步行 灯亮 起 一 段 合 适 的 时 间 。 当 然 ， 我 们 可 用 看 门 
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狗 定时 器 来 寻找 可 能 的 程序 bug， 必 要 时 启动 它 〈 比 如 每 次 灯 改 变 ) ， 万 一 看 门 狗 定时 器 触发 
时 ， 我 们 可 以 让 程序 进入 到 一 个 指定 的 预先 编制 的 普通 状态 或 者 是 紧急 状态 ， 实 际 上 此 时 有 
些 方面 出 错 ， 系 统 需要 进行 检查 。 


9.7 ”本 章 回顾 
* 微 控制 器 是 一 个 小 型 、 单 芯片 、 能 力 有 限 的 用 于 小 规模 操作 (如 设备 控制 或 者 监视 ) 的 
计算 机 。 


。 微 控制 器 用 在 很 多 小 器 具 或 设备 上 ， 这 些 看 起 来 根本 就 不 是 计算 机 ， 如 汽车 的 制 动 系统 。 
。Atmel AVR 是 相关 的 微 控制 器 系列 ， 具 有 专用 的 指令 集 。AVR 体 系 结构 与 典型 的 全 方位 
计算 机 体系 结构 有 显著 不 同 。 例 如 ，AVR 不 支持 浮 点 操作 ， 包 含 少 于 10 000 字 节 的 存储 
器 ， 但 是 对 板 级 外 设 有 广泛 的 支持 。 | 

。 像 很 多 微 控 制 器 一 样 ，Atmel AVR 是 RISC 处 理 的 一 个 范例 。 机 器 指令 数量 相对 很 少 ， 具 
有 专用 性 。 | 

。AVR 是 哈佛 体系 结构 的 一 个 范例 ， 其 存储 器 被 划分 为 多 个 (这 里 是 3 个 ) 不 同 的 体 ， 每 
个 都 有 不 同 的 功能 和 访问 方式 。AVR 的 寄存 器 (和 LO 寄存 器 ) 位 于 3 个 存储 体 之 一 ， 还 
有 专用 RAM 用 来 存储 变量 。AVR 有 一 个 FLASH ROM 体 用 于 保存 程序 ， 以 及 一 个 
EEPROM 体 用 来 存储 静态 变量 ， 这 些 静 态 变量 在 断 电 时 也 要 保留 。 

。Atmel AVR 的 输入 和 输出 通过 存储 体内 的 /0 寄存 器 完成 。 一 个 典型 设备 有 一 个 控制 寄 
存 器 和 一 个 数据 寄存 器 。 被 读 出 和 写 入 的 数据 放 在 数据 寄存 器 中 ， 对 控制 寄存 器 中 的 位 
进行 的 操作 与 要 发 生 的 动作 相符 合 。 不 同 的 设备 有 不 同 的 寄存 器 以 及 不 同 的 操作 。 

。 使 用 中 断 和 相应 的 中 断 处 理 器 可 以 有 效 地 处 理 不 常 出 现 但 期 待 的 事件 。 当 一 个 中 断 发 生 
时 ,通常 的 取 指 ~ 执行 周期 改 成 转移 到 预先 定义 的 位 置 ， 在 此 处 采取 针对 中 断 的 具体 行 
动 。 这 种 中 断 并 不 局 限于 Atmel AVR ,而 是 发 生 在 大 多 数 计算 机 上 ， 包 括 Pentium 和 和 
Power 系 列 。 

。 由 于 硬件 和 能 力 的 限制 ，AVR 只 对 于 某 类 程序 来 说 是 个 好 的 芯片 。 一 个 典型 的 微 控制 器 
程序 是 永远 运行 〈 以 无 限 循环 的 方式 ) 的 状态 机 ， 以 一 个 固定 的 ， 预 先 定义 的 次 序 执行 
一 组 已 经 定义 的 行动 (类似 于 改变 交通 灯 )。 


9.8 习题 


1. 微 控制 器 的 三 个 典型 特征 是 什么 ? 

2. 为 什么 Atmel AVR 在 设计 中 采用 RISC 原 则 ? 

3. 哪 种 典型 的 计算 机 部 件 在 Atmel AVR 中 却 没有 ? 
4. Atmel 是 汉 诺 依 曼 体 系 结构 的 实例 吗 ? 为 什么 ? 
5. RAM 和 ROM 之 间 的 区 别 是 什么 ? 

6. 为 什么 SRAM 比 DRAM 每 字 节 的 成 本 要 高 ? 

7. Atmel AVR 的 存储 体 是 什么 ? 它们 的 用 途 如 何 ? 
8. 看 门 狗 定 时 器 的 功能 是 什么 ? 

9 “存储 器 -WO 映像 ”的 含义 是 什么 ? 

10. 描述 Atmel 所 用 的 让 LED 反 复 暗 亮 的 过 程 。 

11. 如 果 我 们 想 要 交通 灯 在 紧急 模式 下 红 一 上 暗 一 红 一 上 暗 … 闪 烁 


， 如 何 修改 交通 灯 示 例 ? 
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10.1 复杂 和 派生 类 型 


10.1.1 对 派生 类 型 的 需求 

到 现在 为 止 ， 对 计算 的 讨论 都 是 集中 于 在 基本 的 类 型 如 整数 和 浮 点 数 上 的 操作 。 但 多 数 
问题 ， 尤 其 是 大 型 或 复杂 的 问题 ， 需 要 计算 机 关注 非 基本 类 型 上 的 操作 。 例 如 ， 要 回答 “从 
巴尔 的 摩 飞行 到 有 旧金山 的 最 便宜 路 线 是 什么 ?” ”这 个 问题 ， 你 就 需要 了 解 航 班 ， 路 线 及 金额 。 
金额 的 表示 与 浮 点 数 密切 关联 ， 而 路 线 的 表示 则 与 一 序列 的 起 始点 和 停止 点 密切 关联 。 

从 软件 设计 者 的 角度 看 ， 如 果 问 题 的 解 用 高 级 类 型 给 出 的 话 就 容易 理解 得 多 ， 而 计算 机 
却 只 能 在 其 指令 集 范 围 内 对 基本 类 型 进行 操作 。 派 生 类 型 的 概念 很 好 地 填补 了 这 个 润 沟 。 一 
个 派生 类 型 (derived type) 是 一 个 建立 在 基本 类 型 之 上 的 复杂 类 型 ， 使 得 可 在 其 上 执行 高 阶 
计算 。 派 生 类 型 “金额 ”从 一 个 浮 点 数 直 接 建 立 (或 者 更 精确 但 不 那么 直接 ， 可 以 从 各 种 单 
位 的 整数 组 合 建立 ， 这 些 单 位 包括 美元 及 美 分 ， 或 者 是 英镑 、 先 令 、 便 士 以 及 历史 上 使 用 过 
的 法 新 ) 。 派 生 类 型 “地 理 位 置 ”可 由 两 个 分 别 表示 纬 度 和 经 度 的 数字 直接 建立 。 

像 “ 路 线 ” 这 样 非常 抽象 的 概念 可 由 “地 理 位 置 ” 之 间 的 “航班 ”的 “链表 ”建立 ， 每 
个 航班 与 表示 为 “金额 ”的 成 本 相关 联 。 在 这 个 例子 中 ，“ 路 线 ” 就 是 派生 类 型 。 而 “链表 ”、 
“航班 “ “金额” 以 及 “地 理 位 置 ”也 是 派生 类 型 ， 它 们 最 终 作 为 原始 类 型 的 适当 组 合 而 进行 
存储 和 操作 。 从 软件 设计 者 的 角度 看 ， 如 果 这 样 的 类 型 可 在 计算 机 系统 本 身 内 实现 ， 而 且 如 
果 程 序 员 能 使 用 这 些 高 级 操作 的 计算 机 实现 ， 这 就 是 一 个 很 大 的 优势 。 派 生 类 型 使 得 程序 员 
和 系统 设计 者 能 够 以 比 建立 单 块 程序 更 容易 的 方式 建立 复杂 的 系统 。 


10.1.2 派生 类 型 的 一 个 例子 ， 数组 

理论 

最 简单 和 最 常用 的 派生 类 型 之 一 就 是 数组 (array)。 从 理论 和 与 平台 无 关 的 角度 看 ， 数 组 
就 是 由 一 个 整数 来 索引 的 一 组 相同 类 型 的 数据 元 素 。 如 果 必 要 的 话 ， 你 可 以 用 这 个 定义 来 表 
示 数 据 结 构 课 程 班 级 的 某 个 人 。 同 时 ， 让 我 们 再 进一步 解释 一 下 : 一 个 数组 就 是 有 时 被 称 为 
“容器 类 型 ”的 一 个 例子 ， 容 器 类 型 的 意思 是 其 唯一 的 用 途 就 是 存储 其 他 信息 块 以 备 后 用 。 在 
一 个 数组 中 ， 所 有 的 信息 块 必须 是 同一 数据 类 型 ， 如 必须 都 是 整数 或 都 是 字符 。 当 然 ， 它 们 
可 以 有 不 同 的 值 。 最 后 ， 数 据 的 各 个 位 置 用 一 个 数 ， 也 就 是 指定 了 该 特定 元 素 的 一 个 整数 来 
寻 址 。 看 来 还 不 坏 ! 见 图 10-1。 

short figure [ ] = new short [5]， 

如 果 你 有 一 个 1000 个 整数 的 数组 ， 那 么 要 占用 多 大 的 空间 呢 ? 假设 是 4 字 节 整数 ， 那 么 理 
所 当然 就 需要 至 少 4000 个 字 节 。 不 管 使 用 哪 种 机 器 都 是 这 样 的 。 然 而 ， 这 样 大 的 一 块 存储 块 
不 可 能 装 和 人 到 一 个 寄存 器 中 。 幸 运 的 是 ， 这 不 成 问题 ， 因 为 计算 要 在 单个 数据 元 素 上 而 不 是 
在 整个 数组 上 执行 。 这 样 ， 程 序 员 就 能 采用 一 个 策略 来 得 到 数据 。 程 序 员 可 相对 于 数组 的 基 
地 址 (base) 来 存储 数据 ， 该 位 置 也 就 是 数组 访问 的 起 始点 。 在 本 例 中 ， 它 对 应 至 少 4000 字 
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节 长 的 存储 块 ， 通 常 是 数组 的 起 始 元 素 (0 号 元 素 ) 的 存储 地 址 。 程 序 员 还 存储 一 个 偏 移 
(offset)， 就 是 他 或 她 想 要 使 用 的 元 素 的 整数 索引 。 在 8088 或 奔腾 中 ， 这 些 数 要 存储 在 两 个 不 
同 的 寄存 器 中 ， 一 个 特定 的 存储 模式 告诉 计算 机 如 何 将 它们 做 适当 组 合 来 访问 数组 
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图 10-1 显示 一 个 数组 的 存储 布局 情况 的 示意 图 


在 IJVM 中 ， 情 况 有 点 不 同 ， 因 为 “地 址 模式 ”不 真实 存在 。 实 际 情况 是 ， 两 个 数 被 压 人 
到 堆栈 并 执行 特定 的 操作 ， 以 此 来 正确 地 访问 数组 。 实 际 上 ， 根 据 要 作 什么 ， 有 5 种 特定 的 操 
作 。 大 致 根据 需要 程度 ， 这 些 操作 依次 是 ， 

* 创建 一 个 新 的 数组 ， 

* 向 数组 的 一 个 元 素 装 入 一 个 数据 项 ， 

“从 数组 的 一 个 元 素 取得 数据 ; 

* 确定 数组 的 长 度 ， 

* 当 不 再 需要 一 个 数组 时 将 其 销毁 。 

更 重要 的 是 要 注意 ， 从 高 级 语言 序 员 的 角度 (或 从 计算 机 科学 理论 家 的 角度 ) 来 看 ， 
这 两 种 方法 之 间 没 有 真正 的 区 别 。 其 原因 是 数组 在 本 质 上 是 由 其 用 法 定义 的 派生 类 型 。 只 要 
有 执行 这 些 动作 的 某 种 方式 (例如 ， 向 特定 索引 的 数组 元 素 装 入 一 个 值 )， 从 理论 角度 看 具体 
实现 是 无 关 紧 要 的 。 这 一 点 在 讨论 类 时 还 会 谈 及 。 

创建 

显然 ， 数 组 必须 在 使 用 之 前 创建 。 计 算 机 需要 保留 适量 (可 能 很 大 ) 的 存储 块 。 在 像 C++ 
或 Pascal 这 样 的 高 级 语言 中 ， 这 通常 是 在 数组 变量 声明 时 自动 完成 的 。 请 见 下 面 语句 ， 

int sampTe[1000] ; 

该 语句 声明 了 sample 是 一 个 保存 了 整数 int 类 型 元 素 的 数组 变量 ， 并 同时 保留 了 能 保存 从 
[0] 到 [999] 这 1000 个 整数 的 足够 空间 。 在 Java 中 ， 数 组 的 空间 是 通过 显 式 地 数组 创建 来 保留 的 ， 
比如 : 
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int[] sample = new int[1000] ; 

这 里 有 点 区 别 。 在 第 一 个 例子 中 ， 数 组 的 创建 隐 含 在 声明 中 。 而 在 第 二 个 例子 中 ， 数 组 
的 创建 存储 块 的 分 配 ) 是 通过 显 式 的 命令 (“new”) 来 实现 的 。JVM 当 然 不 支持 一 般 意义 上 
的 变量 声明 ， 但 却 支持 数组 创建 。 这 是 通过 使 用 机 器 语言 指令 newarray 来 完成 的 。 为 了 创建 
一 个 数组 ， 程 序 员 (及 计算 机 ) 需要 知道 要 创建 的 数组 大 小 及 其 所 包含 元 素 的 类 型 。 

指令 newarray 接 受 单个 参数 ， 就 是 数组 元 素 的 基本 类 型 。 在 这 方面 汇编 器 有 点 奇怪 ， 因 
为 它 需 要 的 是 类 型 的 Java 名 字 而 不 是 类 型 表达 式 。 例 如 ， 要 创建 前 面 定义 的 数组 ， 类 型 就 是 
“int” 而 不 是 类 型 表达 式 I。 要 创建 的 数组 的 长 度 作为 整数 必须 在 堆栈 上 得 到 。 该 长 度 将 被 弹 
出 ， 会 为 有 适当 长 度 和 类 型 的 新 数组 预 留 空 间 ， 然 后 对 应 于 新 数组 的 地 址 将 压 入 到 堆栈 的 顶 
部 。 这 个 地 址 可 以 适当 地 装 入 和 处 理 。 


JVM 定 义 前 面 数组 的 方法 如 下 : 

1dc 1000 ; 新 是 所 作 鸭 新 娄 组 的 长 度 压 人 
newarray int ; 创建 一 个 整 

astore 1 ; 将 新 到 组 存 基 到 科 \Nvspaces{- 4pt} 


数组 是 基本 类 型 byte ( 字 节 ) 和 char (字符 ) 实际 使 用 的 地 方 。 在 进行 堆栈 计算 时 ， 字 
节 和 字符 值 自动 转换 为 整数 ， 而 在 局 部 变量 中 它们 仍然 是 32 位 的 量 。 这 有 点 浪费 空间 (最 多 
每 个 局 部 变量 浪费 3 个 字 节 ， 一 个 微小 的 数量 ) ， 但 这 比 使 JIVM 存 储 很 小 的 量 浪费 空间 要 少 。 
当 数 组 变 大 时 浪费 的 空间 可 能 会 相当 大 。 事 实 上 ，JVM 甚 至 为 布尔 (Boolean) 数组 提供 一 个 
基本 类 型 ， 因 为 机 器 可 选择 在 一 个 字 节 中 存储 多 达 8 个 布尔 值 (对 于 字 则 是 32 个 )， 这 样 就 将 
空间 效率 提高 了 95% 以 上 。 

从 技术 上 说 ，newarray 指 令 (操作 代码 9xBC) 只 创建 基本 类 型 如 整数 和 浮 点 数 的 一 维 数 
组 。 派 生 类 型 数组 的 创建 要 更 复杂 一 些 ， 因 为 还 要 定义 类 型 。 由 于 派生 对 象 是 由 程序 员 有 些 
随意 定义 的 ， 不 存在 也 不 可 能 存在 所 有 可 能 派生 类 型 的 标准 列表 。JVM 为 创建 派生 类 型 的 一 
维 数组 而 提供 了 一 条 anewarray 指 令 (操作 代码 0xBD )。 如 前 所 述 ,， 数组 大 小 必须 从 堆栈 弹出 ， 
而 类 型 是 作为 一 个 参数 给 出 。 然 而 ， 参 数 本 身 相 当 复 杂 (下 面 要 讨论 到 ) ， 实 际 上 是 指 描述 元 
素 类 型 的 常量 池 中 的 一 个 字符 串 常 量 。 从 JVM 的 角度 看 ， 执 行 操 作 代 码 0xBD 要 比 执行 0xBC 
困难 得 多 ， 因 为 它 要 求 JVM 在 常量 地 中 查找 这 个 字符 串 ， 解 释 这 个 字符 串 ， 检 验 它 确实 有 意 
义 ， 并 有 可 能 加 载 一 个 全 新 的 类 。 从 程序 员 的 角度 看 ， 创 建 一 个 基本 类 型 的 数组 和 创建 一 个 
派生 类 型 的 数组 之 间 差 异 很 微小 ， 对 像 jasmin 这 样 的 汇编 器 的 一 个 可 能 的 功能 增强 就 是 允许 
计算 机 〈 通 过 检查 参数 的 类 型 ) 确定 需要 的 是 操作 代码 0xBC 还 是 0xBD。 

创建 派生 对 象 的 数组 的 最 困难 部 分 是 定义 类 型 。 例 如 ， 要 创建 一 个 字符 串 类 型 的 数组 
( 见 下 面 ) ， 就 必须 使 用 完整 的 类 型 名 “java/lang/String”"。 下 面 的 例子 显示 出 如 何 创建 1000 个 
字符 串 的 数组 : 


1dc 1000 ; 数组 中 有 1000 个 元 素 
anewarray java/1ang/String ; 创建 一 个 字符 串 数组 


这 个 特定 的 指令 非常 不 寻常 而 且 是 JVM 所 特有 的 。 大 多 数 计 算 机 不 在 指令 集 的 层次 上 提 
供 这 类 分 配 存储 块 的 支持 ， 甚 至 更 少 的 计算 机 支持 有 类 型 块 分 配 的 思想 。 然 而 ， 支 持 有 类 型 
计算 的 能 力 ， 甚 至 当 所 涉及 的 类 型 是 由 用 户 定义 时 ， 对 于 JVM 设 计 者 所 预想 的 跨 平 台 安 全 性 
尤为 关键 。 

除了 创建 简单 的 一 维 数 组 ，JVM 还 为 创建 多 维 数组 提供 了 一 条 快捷 指令 。 
multianewarray 指 令 (注意 拼写 有 点 复杂 ) 从 堆栈 弹出 变化 的 维 数 ， 并 生成 一 个 适当 类 型 的 
数组 。multianewarray 的 第 一 个 参数 以 类 型 表达 式 的 快捷 表示 定义 了 数组 的 类 型 (应 注意 ， 
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不 是 数组 元 素 的 类 型 ) ， 第 二 个 参数 定义 了 维 数 ， 也 因而 定义 了 需要 弹出 的 堆栈 元 素 的 数量 。 
例如 ， 下 面 的 代码 就 规定 要 从 堆栈 弹出 3 个 数 ， 生 成 一 个 三 维 数组 ， 


bipush 6 ; 在 第 三 维 的 数组 大 小 =6 
bipush 5 ; 在 第 二 维 的 数组 大 小 =5 
bipush 3 ; 在 第 一 维 的 数组 大 小 =3 


multianewarray [[[F 3 生成 一 个 3 x 5 x 6 的 浮 点 数组 


注意 ， 最 终生 成 的 数组 有 三 维 ， 总 大 小 为 3 x 5 x 6。 第 一 个 参数 “[[[F” 将 最 终 数组 的 类 
型 定义 为 三 维 浮 点 数组 (3 个 [)。 

类 型 系统 扩展 

从 先前 对 System.out 和 打印 各 种 内 容 的 讨论 中 ， 你 应 该 对 系统 如 何 对 JVM 表 达 类 型 有 所 了 
解 。 表 10-1 的 上 半 部 分 列 出 了 常见 的 基本 类 型 (这 些 类 型 用 在 newarray 指 令 及 JVM 表 达 式 中 ， 
并 可 能 在 对 invokevirtua1 或 multiarray 的 调用 中 用 到 )。 除 了 我 们 已 经 熟悉 的 那些 基本 计算 
类 型 ，JVM 将 字 节 〈(B)、 短 整数 (S) 、 字 符 〈C) 以 及 布尔 (Z) 也 看 作 是 基本 类 型 ， 这 些 也 
列 在 表 10-1 中 。 

派生 类 型 正如 所 料 是 由 底层 类 型 的 表达 式 派 生出 来 的 。 例 如 ， 一 个 数组 的 类 型 描述 就 是 
一 个 起 始 方 括号 〈[) 后 跟 数组 中 每 个 元 素 的 类 型 。 注 意 ， 不 需要 结束 方 括号 ， 事实 上 也 不 人 允 
许 。 这 已 经 让 不 止 一 个 程序 员 感 到 困惑 。 整 数 数组 的 表达 式 就 是 [1， 而 一 个 二 维 浮 点 数组 
(和 矩阵) 的 表达 式 就 是 [[F， 这 在 字面 上 表达 的 意思 就 是 ， 一 个 数组 ([)， 其 中 的 每 个 元 素 都 
是 一 个 浮 点 数组 ([F)。 


表 10-1 类 型 描述 表达 式 





类 型 JVM/jasmin 表 达 式 

整数 (int) 

长 整数 (long) 9 
浮 点 数 (float) F 
双 精 度数 (double) D 
字 节 (byte) B 
短 整 数 (short) S 
字符 (char) C 
布尔 (boolean) Z 
void (返回 类 型 ) v 
X 类 型 的 数组 听 
类 Y LY; 
接受 X 返 回 Y 的 函数 (OY 


类 和 类 类 型 用 完全 限定 类 名 来 表达 ， 前 面 有 一 个 大 写 的 L， 后 面 有 一 个 分 号 (;)。 例 如 ， 
系统 的 输出 System.out 就 是 一 个 PrintStream 类 的 对 象 ， 存 储 在 java.io (或 java/io) 目录 和 包 中 。 
这 样 ，System.out 的 正确 的 类 表达 式 就 是 Ljava/io/PrintsStream; ， 这 在 前 面 的 很 多 例子 中 已 
经 用 过 了 。 

这 些 类 的 构造 函数 可 根据 需要 结合 起 来 以 表示 复杂 的 类 型 。 例 如 ， 标 准 Java 对 “main” 
例 程 的 定义 要 接受 一 个 字符 串 数 组 作为 参数 。 在 Java 中 ， 写 作 如 下 的 一 行 代码 : 

public static void main(String [] args) 

String 是 系统 在 java.lang 包 中 定义 的 一 个 类 ， 所 以 会 表示 成 Ljava/1ang/String;， 而 参数 
就 是 这 种 String 的 一 个 数组 。 这 个 main 方 法 不 对 调用 环境 返回 任何 值 ， 因 此 声明 的 返回 类 型 是 


冲 10 间 JVM 高 级 编程 问题 151 


void。 以 下 是 我 们 熟悉 的 迄今 在 很 多 方法 前 面 都 出 现 的 语句 : 

.method public static main([Ljava/lang/String;)V 

该 语句 声明 了 main 方 法 接受 一 个 String 的 数组 作为 唯一 的 参数 而 不 返回 任何 值 (void)。 
从 这 个 例子 显然 可 以 看 出 ， 这 个 类 型 系统 不 仅 用 于 描述 数组 类 型 ， 而 且 还 用 于 方法 的 定义 ， 
这 将 在 后 面 讨 论 。 

存储 

要 存储 数组 的 一 项 ，JVM 根 据 元 素 的 类 型 提供 了 若干 个 类 似 的 指令 。 为 简单 起 见 ， 暂 时 
假设 是 整数 的 数组 〈[I)。 为 了 在 数组 中 的 一 个 位 置 存储 一 个 值 ， JVM 需 要 知道 3 件 事情 ， 哪 
个 数组 、 哪 个 位 置 以 及 哪个 值 。 程 序 员 必 须 将 这 3 个 值 (以 这 个 次 序 ) 压 人 到 堆栈 上 ， 然 后 执 
行 指令 iastore。 这 个 操作 有 点 不 寻常 ， 因 为 它 不 向 堆栈 压 入 任何 东西 ， 所 以 其 纯粹 效果 就 是 
将 堆栈 大 小 减 小 3。 

图 10-2 给 出 的 简单 例子 显示 出 如 何 将 数据 存储 到 数组 。 这 个 代码 片断 首先 创建 一 个 10 个 
整数 的 数组 ， 然 后 将 数 0 一 9 存储 为 相应 的 数组 元 素 (图 10-3)。 

bipush 10 ; 需要 10 个 元 素 


newarray I ; 创建 一 个 10 个 整数 的 数组 
astore-1 ; 将 数组 存储 到 位 置 #1 


iconst_0 ; 装 入 一 个 0， 准 备 循环 
istore_2 ; 并 存储 到 #2 


al oad_1 ; 装 入 数组 


iload_2 ; 装 入 位 置 

iload_2 ; 装 和 人 值 (与 位 置 一 样 ) 

iastore ; 置 array[ 位 置 ]= 值 

iinc 2 1 ; 将 1 加 到 #2 (位 置 和 值 ) 
iload_2 ; 我 们 微 完了 3， (位 置 >10 吗 ) ? 
bipush 10 ; 装 入 10 来 进行 比较 

if_icmp1t Loop ; 如 课 还 不 到 1 号 到 Loop 再 重复 


: 我 们 做 完了 ! 





图 10-2 在 数组 中 存储 的 例子 


0x3000 
0x3004 
Ox3008 
Ox300C 
0x3010 
0x3014 
0x3018 
0x301C 
0x3020 


0x3024 





图 10-3 图 10-2 的 存储 布局 
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对 于 其 他 的 基本 类 型 包括 并 非 用 于 计算 的 字符 和 短 整 数 ，JVM 采 用 在 首 字母 定义 变化 
形式 的 标准 方法 来 提供 适当 的 类 型 。 例 如 ， 要 在 一 个 长 整 型 数组 中 存储 一 个 元 素 ， 可 使 用 
lastore 指 令 。 要 在 数组 中 存储 一 个 非 基 本 类 型 (地址 类 型 ， 如 数组 的 数组 或 对 象 的 数组 ) 的 
元 素 ， 元 素 就 存储 成 地 址 (a) ， 所 以 指令 就 是 aastore ( 见 表 10-2)。 唯 一 棘手 的 是 布尔 类 型 
的 数组 和 字 节 类 型 的 数组 ， 两 个 都 用 b 字 母 打 头 。 幸 运 的 是 ，JVM 本 身 能 处 理 这 个 二 义 性 ， 因 
为 它 对 字 节 数组 和 布尔 数组 都 用 bastore 指 令 ， 并 且 能 自行 区 分 。( 的 确 ， 这 里 撒 了 一 个 小 谎 。 
在 大 多 数 的 JVM 实 现 中 ， 尤 其 是 来 自 Sun 微 系统 公司 的 实现 ， 机 器 不 用 费心 去 区 分 ， 因 为 它 就 
是 使 用 字 节 来 存储 布尔 数组 的 元 素 。 这 导致 每 个 布尔 元 素 大 概 浪费 7 位 ， 但 在 效率 上 仍 是 可 接 
受 的 )。 


表 10-2 装 入 和 存储 值 的 数组 操作 . 
数组 元 素 类 型 存储 操作 装 人 操作 


整数 (int) iastore iaload 
长 整数 (long) lastore laload 
双 精 度数 (double) dastore daload 
浮 点 数 (float) fastore faioad 
字符 (char) castore caload 
短 整 数 (short) sastore saload 
字 节 (byte) bastore baload 
布尔 (boolean) bastore baload 
数组 {地 址 ) aastore aaload 
对 象 (地 址 ) aastore aaload 





存储 一 个 多 维 数组 必须 通过 一 个 存储 序列 来 完成 。 由 于 一 个 多 维 数组 实际 上 存储 成 (并 
视 为 ) 数组 的 数组 ， 首 先 必 须 装 人 相关 的 子 数组 ， 然 后 在 子 数组 内 进行 装 入 和 存储 。 图 10-4 
显示 出 一 个 将 数 100 放 和 人 到 整数 矩阵 中 的 一 个 槽 (这 里 是 位 置 [1][2]) 的 代码 片段 : 

bipush 3 ; 第 二 维 的 维 数 是 3 
bipush 4 ; 第 一 维 的 维 数 是 4 


multianewarray [[I 2 ; 生成 4 x 3 的 整数 数组 
astore_1 ; 将 数组 存 到 #1 


aload_1 ; 装 入 数组 
iconst_1 ; 我 们 感 兴趣 的 是 a[1][?] 


aaload ; 得 到 a[1] (一 行 3 个 整数 ) 
iconst_2 ; 得 到 位 置 2 

bipush 100 ; 装 入 100， 要 放 入 到 数组 a[1] 
iastore ; 将 100 存 储 到 a[1][2] 





图 10-4 多 维 数组 的 创建 和 存储 的 例子 


装 入 
装 入 和 存储 的 原理 一 样 。JVM 提 供 一 组 ?aToad 系 列 的 指令 ， 用 来 从 数组 中 取出 一 个 元 素 。 
要 使 用 这 些 指令 ， 就 要 压 人 数组 和 期 望 的 位 置 。 指 令 将 弹出 这 些 参 数 ， 然 后 提取 出 存储 在 那 
个 位 置 上 的 值 并 压 入 ， 如 下 所 示 : 
aload_1  ; 装 入 存储 在 得 的 1000 个 整数 的 数组 


bipush 56 ; 压 入 值 (就 是 期 望 的 位 置 ) 56 
iaload  ; 提取 出 array[56] 的 整数 并 压 和 人 
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获取 长 度 

获取 一 个 数组 的 长 度 是 容易 的 。arraylength 指 令 弹 出 堆栈 (当然 必须 是 一 个 数组 ) 的 第 
一 项 ， 并 压 入 数组 的 长 度 。 例 如 ， 下 面 的 代码 就 装 入 先前 创建 的 样 例 数组 ， 获 得 其 长 度 ， 并 
将 整数 值 1000 留 在 堆栈 上 : 





aload_1 ; 装 入 先前 定义 的 样 例 (1000 个 整数 的 数组 ) 
arraylength ; 弹出 样 例 ， 压 人 样 例 的 长 度 
销 裔 


与 前 面 的 操作 不 同 ， 不 再 需要 一 个 数组 的 内 容 时 销毁 该 数组 非常 简单 。JVM 标 准 的 定义 
是 ， 机 器 本 身 应 该 定期 地 进行 垃圾 收集 (garbage collection) ， 寻 找 程序 不 再 使 用 的 存储 空间 、 
类 实例 以 及 变量 。 一 且 发 现 ， 就 回收 并 使 之 可 再 使 用 。 

对 于 垃圾 收集 例 程 的 精确 定义 和 操作 ， 各 种 JVM 实 现 各 有 不 同 。“ 垃 圾 ”的 一 般 定 义 是 程 
序 不 再 能 达到 的 存储 位 置 。 例 如 ， 如 果 局 部 变量 #1 装 有 一 个 数组 (是 数组 地 址 的 唯一 撕 贝 )， 
则 该 数组 及 其 内 部 的 每 个 元 素 都 是 可 达到 并 可 用 于 计算 的 。 如 果 程 序 员 要 对 局 部 变量 #1 进行 
写 覆 盖 ， 则 虽然 数组 本 身 没有 变化 ， 但 不 可 能 再 访问 其 内 部 的 信息 了 。 从 这 一 点 看 ， 该 数组 
所 占用 的 存储 空间 (可 能 很 大 ) 不 再 存储 任何 有 用 的 东西 ， 就 要 回收 另 做 他 用 。 唯 一 的 问题 
就 是 没有 办 法 精确 地 预测 这 种 回收 可 能 在 什么 时 候 发 生 ， 而 JYM 的 实现 不 完成 任何 垃圾 回收 
在 技术 上 也 是 合法 的 。 

从 程序 员 的 角度 看 ， 没 有 必要 明确 地 销毁 一 个 数组 。 弹 出 或 者 写 覆 盖 对 数组 的 所 有 引用 
(这 在 程序 正常 运行 过 程 中 经 常 自动 发 生 ) ， 就 会 导致 数组 变 得 不 可 达到 ， 成 为 垃圾 ， 并 因而 
被 回收 。 


10.1.3 记录 : 没有 方法 的 类 
理论 
下 一 个 最 简单 的 类 型 称 为 结构 (structure) 或 者 记录 (record) 。 与 数组 一 样 ， 这 是 一 个 容 
器 类 型 。 与 数组 不 一 样 的 是 ， 存 储 在 记录 中 的 数据 包含 在 命名 的 域 中 ， 并 可 以 是 不 同 的 类 型 。 
记录 提供 了 将 相关 数据 一 起 保存 在 一 个 逻辑 位 置 上 的 BaseballPlayer 类 
方法 。 如 果 愿 意 ， 你 可 以 将 一 个 记录 看 作 是 一 个 电子 Name (String) 
棒球 交易 卡 ， 里 面 携 带 了 所 有 与 一 个 球 手相 关 的 信息 Year (1) 
( 击 球 率 、 本 垒 打 次 数 、 上 场 击 球 次 数 、 击 球 跑 垒 得 分 、 Team (String) 
盗 垒 数 ， 等 等 ) ， 这 些 信 息 以 一 致 的 、 易 于 传输 的 格式 Games (1) 
存储 ( 见 图 10-5)。 这 些 信息 的 每 一 个 部 分 都 与 特定 的 a 
域名 关联 (例如 ,“RBI” 表 示 击 球 跑 垒 得 分 ) ， 并 有 


Hits (1) 


不 同 的 类 型 ( 击 球 率 定义 为 浮 点 数 ， 本 双打 次 数 是 整 baiwe AverageiF， 
数 , 而 位 置 “shortstop”( 游 击 手 ) 其 至 是 一 个 字符 囊 )。 
一 个 更 简单 的 例子 是 有 两 个 整数 域 分子 和 分 母 ) 的 





图 10-5 一 个 音 写 能 < 信息 记忆 
分 数 。 图 个 部 分 填写 的 棒球 卡 信息 记录 


与 数组 不 同 ， 每 个 记录 的 类 型 必须 在 编译 时 由 程序 员 分 别 定义 。 定 义 主要 由 一 列 必 要 的 
域名 及 其 各 自 的 类 型 所 组 成 。 这 些 都 存储 在 一 个 看 上 去 很 熟悉 的 文件 中 ， 如 图 10-6 所 示 。 

这 个 例子 程序 显示 了 记录 类 型 的 一 个 简单 实例 ， 就 是 分 数 (或 者 数学 家 也 可 能 将 其 看 作 
是 有 理 数 ) 。 分 数 形 式 上 被 定义 为 两 个 整数 的 比值 ， 这 两 个 整数 分 别称 为 分 子 〈 在 顶 上 的 数 ) 
和 分 母 〔 在 底下 的 数 )。 在 这 个 文件 中 的 两 个 关键 行 就 是 用 .field 汇 编 指 令 开 头 定义 了 这 两 个 
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域 。 比 如 ， 见 下 面 一 行 : 


.field public numerator I 


; “fraction” 类 型 的 结构 定义 


.Class public fraction 
.Super java/lang/Dbject 


.field public numerator I 
.field public denominator I 


; 样板 一 一 因为 “结构 ”实际 上 是 “类 ”所 以 这 是 需要 的 
.method public <init>()V 
aload_0 
invokespecial java/lang/0bject/<init>OV 
return 
.end method 





图 10-6 一 个 将 fraction 定 义 为 派生 类 型 的 记录 样 例 


该 行 定 义 一 个 名 为 numerator 的 域 ， 其 值 是 “I” 类 型 (如 前 所 述 ，I 代 表 整 数 )。 一 个 域 
如 果 其 什 是 长 整数 昏 " QQus) 议 用 “J”， 知 果 其 值 是 字符 申 型 《Strisg) 就 月 去 达 趟 
“Ljava/lang/String;”， 这 些 我 们 前 面 已 经 看 到 。public 关 键 字 指出 分 子 值 是 “public”， 意 思 是 
它 可 以 被 系统 中 的 其 他 函数 和 其 他 对 象 访问 、 读 以 及 修改 。 

文件 的 其 余部 分 是 什么 意思 ? 仔细 观察 你 会 发 现 ， 从 类 定义 的 第 一 个 例子 开始 ， 我 们 用 
的 都 是 同一 个 样板 。 其 原因 很 简单 : 记录 在 JVM 中 被 实现 为 一 个 类 ， 所 以 要 使 系统 的 其 余部 
分 能 与 新 定义 的 记录 相互 作用 ， 就 必须 也 要 有 一 个 最 小 的 类 开销 。 现 在 没有 其 他 问题 了 ， 让 
我 们 特别 地 将 类 看 作 是 派生 类 型 并 了 解 其 优点 。 


10.2 类 和 继承 


10.2.1 定义 类 

编程 技术 (或 者 更 准确 地 说 是 程序 设计 技术 ) 最 主要 的 进步 是 面向 对 象 (object- 
orientated) 编程 技术 的 发 展 。 在 这 个 框架 下 ， 大 型 程序 的 设计 是 通过 采用 较 小 的 交互 式 对 象 
(interactive object) 系统 来 实现 的 ， 这 些 对 象 独立 地 负责 自己 的 数据 处 理工 作 。 一 个 常用 的 比 
喻 是 餐馆 。 就 餐 者 可 点 他 喜欢 的 任何 菜肴 而 无 须 关 心 做 菜 的 细节 ， 那 是 厨师 的 任务 。( 厨 师 也 
无 须 关心 是 谁 点 了 某 个 菜 ， 那 是 服务 员 的 任务 )。 这 种 责任 的 划分 确 有 好 处 ， 因 为 为 茶 个 用 途 
编写 的 代码 片段 常常 能 重新 用 于 其 他 的 用 途 ， 而 大 型 系统 若 看 作 是 一 组 相互 作用 的 对 象 来 建 
立 就 相对 容易 。 作 为 重复 使 用 的 例子 ， 在 3.4.1 节 设计 的 随机 数 生成 器 就 可 在 任何 需要 随机 数 
的 时 候 使 用 ， 不 管 是 做 蒙特 卡 洛 模拟 、 还 是 维 加 斯 赌博 游戏 、 或 者 是 第 1 人 称 枪战 游戏 。 

为 了 将 这 些 对 象 结构 化 ， 形 成 一 致 的 框架 ， 通 常 将 它们 分 组 并 写成 类 (class)， 类 就 是 具 
有 类 似 性 质 的 对 象 。 两 个 随机 数 生成 器 在 很 多 方面 是 相同 的 ， 即 使 具体 的 参数 或 操作 可 能 不 
同 。 特 别 是 ， 外 部 的 观察 者 想 要 对 随机 数 生成 器 所 做 的 事情 (确定 种 子 使 之 达到 一 个 开始 生 
成 随机 数 的 状态 ， 或 者 从 生成 器 得 到 一 个 新 的 随机 数 ) 是 相同 的 。 这 样 我 们 就 可 以 从 操作 的 
角度 来 定义 “随机 数 生成 器 ”这 个 概念 ， 也 就 是 说 ， 不 是 根据 它 如 何 工作 而 是 根据 我 们 如 何 
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对 其 操作 来 进行 定义 。 任 何 自称 为 随机 数 生成 器 的 东西 都 要 完成 这 两 个 操作 。 

这 就 得 到 一 个 熟悉 的 类 的 形式 化 定义 ， 就 是 将 类 (class) 定义 为 派生 类 型 的 抽象 描述 ， 
该 派生 类 型 由 一 组 命名 的 而 不 是 编号 的 ) 并 有 不 同类 型 的 域 所 组 成 。( 听 起 来 是 不 是 很 像 是 
记录 ? ) 。 不 同 之 处 是 类 还 包含 方法 (method) ， 即 定义 了 与 该 类 交互 的 合法 方式 的 函数 。 最 
后 ， 一 个 对 象 (object) 是 一 个 类 的 示例 或 实例 化 ， 所 以 如 果 将 类 看 作 是 一 个 抽象 的 概念 (如 
“汽车 ”)， 对 和 象 就 是 一 个 特定 的 汽车 ， 如 我 过 去 在 高 中 常常 使 用 的 那 辆 老式 的 VM Bug。 

快速 回顾 一 下 ，( 从 外 部 来 看 ) 类 就 是 将 对 象 聚合 起 来 的 一 种 方式 ， 这 些 对 象 具 有 类 似 的 
性 质 ， 我 们 可 用 相同 的 方式 与 其 打交道 。 在 一 个 正在 运行 苹果 的 OS X 操 作 系 统 的 计算 机 上 ， 
所 有 的 窗口 在 左上 角 都 有 三 个 按钮 : 红色 按钮 用 于 删除 窗口 ， 黄 色 按 钮 用 于 使 窗口 变 为 图 标 ， 
绿色 按钮 用 于 使 窗口 扩大 。 一 旦 用 户 掌握 了 如 何 与 任何 一 个 窗口 打交道 ， 她 就 能 与 所 有 的 窗 
口 打交道 。 这 个 思想 被 推广 形成 类 、 对 象 以 及 方法 的 概念 。 特 别 是 ， 每 个 对 象 (也 就 是 类 的 
实例 ) 共享 相同 的 方法 ， 即 所 定义 的 与 该 对 象 交互 作用 的 函数 。 如 果 你 了 解 了 如 何 驾驭 一 辆 
VM Bug， 你 就 能 驾驶 所 有 的 VM Bug， 因 为 驾驭 的 “方法 ”是 相同 的 。 

在 JVM 上 编程 时 ， 这 种 观点 同样 适用 ， 因 为 两 个 对 象 表示 成 类 文件 的 独立 实例 ， 每 个 类 
文件 在 很 大 程度 上 是 独立 的 ， 并 依赖 于 相同 的 方法 在 JVM 字 节 码 层次 上 进行 通信 。 我 们 在 前 
面 的 程序 中 已 经 看 到 这 样 的 例子 ， 多 是 在 与 系统 输出 进行 交互 。 

详细 情况 如 下 : 

。System.out (在 jasmin 中 是 System/out ) 是 一 个 特殊 的 对 象 。 

。 System/out 实 例 化 了 java/io/PrintsStream 类 。 

。 所 有 的 PrintStream 对 象 都 有 一 个 print1in 方 法 。 

。 println 方 法 能 使 一 个 字符 串 出 现在 “通常 ”的 位 置 ， 对 于 不 同 对 象 可 以 改变 这 个 位 置 。 

对 于 System/out， 它 出 现在 诸如 屏幕 的 标准 输出 中 。 
。 要 做 到 这 一 点 ， 可 使 用 invokevirtual 指 令 来 触发 适当 对 象 (System/out) 上 的 适当 方 
法 (println) [并 且 还 要 以 适当 的 类 型 (PrintStream) ]。 

每 个 系统 都 要 求 〈 通 过 Java/JVM 标 准 文档 ) 提供 一 个 PrintStream 类 以 及 一 个 Systemy/out 对 
象 作 为 该 类 的 成 员 。 具 体 的 细节 (例如 ， 是 打印 到 磁盘 文件 ， 还 是 打印 到 屏幕 窗口 ， 还 是 打 
印 到 打印 机 ) 由 单独 的 类 确定 。 而 且 ， 建 立 另 一 个 将 其 数据 打印 到 不 同位 置 的 对 象 是 件 容易 
的 事情 。 这 样 ， 要 打印 到 文件 而 不 是 到 屏幕 ， 你 可 以 不 调用 System/out 的 println 方 法 ， 而 是 调 
用 新 对 象 的 相同 方法 。 

Java 不 强迫 使 用 面向 对 象 的 编程 ， 但 为 这 种 语言 设计 的 结构 使 得 使 用 面向 对 象 编程 更 容 
易 而 且 更 有 利 。 另 外 ，JVM 的 结构 也 不 强迫 使 用 面向 对 象 的 编程 ， 但 确实 鼓励 使 用 面向 对 象 
编程 。 特 别 是 ，JVM 明 确 地 将 可 执行 文件 存储 成 类 文件 (class file) ， 正 如 所 见 ， 这 使 得 利用 
交互 作用 的 类 建立 大 规模 系统 非常 容易 。 我 们 在 下 面 给 出 这 种 派生 类 的 一 些 例 子 。 


10.2.2 一 个 简单 的 类 : String 

类 与 数组 和 域 一 样 是 派生 类 型 ， 但 类 定义 所 包括 的 各 种 方法 使 其 难 理解 得 多 。 派 生 类 型 
的 一 个 典型 但 相对 容易 理解 的 例子 是 标准 的 Java String 类 ， 定 义 为 Java.lang (或 Java/lang) 包 
的 组 成 部 分 。String 类 简单 地 保存 一 个 不 可 改变 的 字符 串 ， 如 “Hello，word! ”， 这 个 字符 串 
也 许 就 要 被 打印 。 这 个 类 定义 了 在 一 个 String 中 要 用 到 的 数据 类 型 (通常 是 字符 的 数组 ) ， 也 
定义 了 一 组 方法 、 函 数 及 操作 ， 它 们 是 与 String 类 进行 交互 作用 的 合法 途径 。 我 们 一 直 都 在 使 
用 String 对 象 却 没 有 对 其 性 质 有 一 个 正式 的 了 解 。 
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使 用 一 个 String 

除了 存储 具体 的 字符 串 值 ，String 还 支持 大 量 的 计算 方法 ， 用 来 检查 String 以 确定 其 性 质 。 
例如 ， 方 法 charAt0 的 功能 就 是 接受 一 个 整数 并 返回 其 所 指定 位 置 的 字符 。 

在 Java (或 者 一 个 等 价 的 面向 对 象 的 高 级 语言 ) 中 ， 这 个 函数 将 被 定义 成 适合 调用 的 方 
式 ， 就 像 如 下 所 示 : 


class java.lang.String { 
char charAt (Cint); 
了 


这 个 既 用 于 定义 也 用 于 调用 的 方案 指出 ， 方 靶 charAt() 是 类 String 的 一 部 分 (String 本 
身 又 是 java/lang 包 的 一 部 分 ) ， 它 接受 一 个 整数 作为 参数 并 返回 一 个 字符 值 。 在 jasmin 中 ， 同 
样 的 这 些 概念 将 用 稍微 不 同 的 语法 来 表达 ， 也 就 是 用 在 表 10-1 给 出 的 语法 来 表达 。 

java/lang/String/charAt (I)C 

(快速 复习 ; 这 行 的 意思 是 符号 “charAt” 是 一 个 函数 ， 它 接受 类 型 I 并 返回 类 型 C。) 我 
们 将 会 看 到 ， 这 类 语 靶 既 用 于 定义 方法 本 身 也 用 于 针对 任何 特定 的 串 调 用 方法 。 

compareT0( ) 方 法 的 功能 是 比较 当前 String 与 另 一 个 String 以 确定 哪 一 个 字母 顺序 优先 。 如 
果 this ( 指 当前 串 ) 比 参 数 String 在 字典 中 靠 前 ， 即 可 能 更 短 或 者 某 字符 在 通常 的 排序 中 更 靠 
前 ， 则 返回 的 就 是 一 个 负 整 数 。 如 果 this 比 String 参 数 更 靠 后 ， 返 回 的 就 是 正 整 数 。 如 果 两 个 
String 正 好 相等 ， 则 返回 0。 在 jasmin 表 示 法 中 ， 这 个 方法 表示 如 下 : 

java/lang/String/compareTo(Ljava/lang/String;)I 

属于 String 类 的 其 他 方法 还 包括 : equa1ls( ) 的 功能 是 返回 一 个 布尔 值 以 指示 两 个 串 是 否 相 
等 ; Equal1sIgnoreCase( ) 的 功能 是 做 同样 的 判断 但 忽略 大 小 写 (所 以 “Fred” 与 “fred” 不 
相等 但 equalsIgnoreCase 将 为 真 ) ， index0f( ) 的 功能 是 返回 作为 参数 的 字符 首次 出 现 的 位 
置 ， length() 的 功能 是 返回 String 的 长 度 ; toUpperCase() 的 功能 是 返回 一 个 新 串 ， 其 中 的 
所 有 字符 都 已 经 被 转换 成 大 写字 母 。 总 共有 超过 50 种 不 同 的 方法 ， 这 不 包括 那些 隐 含 地 从 
Object 类 继承 来 的 方法 ， 这 些 方法 经 由 标准 定义 ， 成 为 JVM java.lang.String.class 的 一 部 分 。 


10.2.3 实现 String 

在 底层 以 及 在 字 节 码 级 别 ，String 是 如 何 实现 的 呢 ? 答案 虽然 令 人 烦恼 却 是 有 意义 的 ， 那 
就 是 如 何 实现 无 关 紧 要 ! 任何 实现 了 必要 的 50 种 方法 的 合法 JVM 类 ， 无 论 实 际 的 细节 如 何 ， 
都 是 String 类 的 合法 版 本 。 只 要 其 他 的 类 只 使 用 定义 明确 的 标准 方法 来 与 String 类 交互 作用 ， 
用 户 就 会 发 现 表 现 很 好 的 String 类 会 满足 他 们 的 需要 。 

例如 ， 实 现 String 的 一 个 (没有 价值 的 ) 可 能 性 就 是 看 作 是 对 单个 字符 变量 的 有 序 收 集 ， 
每 个 字符 变量 表示 String 中 的 单个 字符 。 从 程序 员 的 角度 看 ， 这 有 一 些 明显 的 缺陷 ， 因 为 他 需 
要 创建 很 多 名 字 类 似 seventyeighthcharacter 的 变量 。 一 个 更 好 的 解决 方案 是 采用 一 个 简单 
的 派生 类 型 ， 如 一 个 字符 数组 ( 见 前 面 )。 即 使 在 这 里 也 还 有 一 些 选择 。 例 如 ， 为 了 尽量 节省 
空间 而 采用 字 节 数组 (如 果 设 计 者 预计 要 处 理 的 String 都 是 ASCII[ 串 ， 这 样 也 就 没有 必要 处 理 
UTF-16 串 了 )。 还 可 以 使 用 整数 数组 以 简化 必要 的 计算 。String 可 在 数组 中 以 正常 顺序 存储 ， 
使 得 数组 的 第 一 个 元 素 对 应 于 串 的 首 字符 ， 或 者 也 可 用 相反 的 顺序 存储 ， 以 简化 endsWith() 
方法 的 实现 。 

类 似 地 ， 也 可 以 选择 是 否 创 建 一 个 特殊 的 域 ， 用 以 将 串 的 长 度 保 存 为 整数 值 。 如 果 采 用 
这 种 做 法 ， 就 会 使 每 个 String 对 象 更 大 和 更 复杂 一 些 ， 但 也 会 使 length () 方法 使 用 得 更 快 一 
些 。 像 这 样 的 权衡 取舍 或 许 对 于 系统 的 总 体 性 能 是 重要 的 ， 但 对 于 程序 员 的 String 版 本 是 否 合 
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法 没有 影响 。 其 他 任何 人 使 用 String 类 时 会 发 现 ， 如 果 所 有 方法 都 有 且 正 确 ， 那 么 他 们 的 程序 
总 会 正确 运行 。String 类 文件 与 使 用 String 的 类 文件 之 间 没 有 必要 存在 特殊 的 关系 。 

构造 一 个 String 

String 有 一 个 特殊 的 方法 ， 通 常 称 为 构造 函数 (constructor)， 可 用 来 构造 一 个 新 的 String。 
这 个 方法 不 接受 参数 ， 而 且 ， 由 于 生成 的 String 是 零 长 度 且 无 字符 ， 所 以 在 大 部 分 时 间 并 无 太 
大 用 处 。 用 迄今 本 书 所 使 用 的 符号 ， 这 个 构造 函数 反 述 如 下 : 

java/lang/String/<init>OV 

为 了 更 容易 和 更 有 用 ，String 类 还 有 很 多 (大约 11 个 ) 其 他 的 构造 函数 ， 人 允许 指 定 要 创建 
的 String 的 内 容 。 例 如 ， 程 序 员 可 通过 复制 一 个 已 存在 的 String 来 创建 新 的 String， 

java/lang/String/<init>(Ljava/lang/String;)V 

也 可 以 从 StringBuffer (能 从 一 个 可 变 的 字符 串 构造 出 不 可 变 的 字符 串 ) 创建 一 个 字符 串 ， 

java/lang/String/<init>(Ljava/lang/StringBuffer;)V 

或 者 直接 从 一 组 字符 创建 : 

java/lang/String/<init>([OV 


其 中 的 任何 一 个 构造 函数 都 对 String 的 创建 及 其 内 容 提 供 控制 。 
10.3 类 的 操作 和 方法 


10.3.1 类 操作 介绍 

一 般 来 说 ， 类 比 数组 要 困难 得 多 ， 因 为 要 求 类 能 够 (或 者 至 少 允 许 ) 提供 比 数组 更 多 的 
操作 和 更 多 种 的 操作 。 由 于 这 个 原因 ， 随 时 创建 一 个 新 的 类 通常 不 现实 (虽然 总 可 以 通过 实 
例 化 一 个 现 有 的 类 来 创建 新 的 对 象 )。 就 像 我 们 一 直 采 用 的 做 法 ， 类 是 通过 .class 文 件 来 定义 
的 。 类 的 基本 性 质 ， 如 域 和 方法 ， 是 通过 jasmin 汇 编 指令 在 编译 时 定义 的 。 这 些 域 和 方法 一 
经 定义 ， 就 可 由 系统 上 的 任何 人 使 用 (要 有 适当 的 访问 许可 )。 


10.3.2 域 操 作 

创建 域 

与 数组 不 同 ， 类 中 的 域 带 有 名 字 ， 而 不 是 编号 的 。 然 而 ， 不 同类 的 域 可 能 有 相同 的 名 字 ， 
从 而 可 能 引起 模糊 和 混淆 。 为 此 ， 使 用 域 时 应 该 用 全 称 描述 ， 包 括 该 域 所 在 类 的 名 字 。 

要 生成 一 个 域 ，jasmin 使 用 汇编 指令 .fie1d， 如 下 所 示 (在 图 10-6 中 也 有 显示 ) : 

.field public AnExampleField I 

这 个 例子 在 当前 类 中 创建 一 个 域 ， 名 为 AnExampleField， 其 中 包含 一 个 int 类 型 的 变量 。 
由 于 这 个 类 被 声明 为 public (公共 ) 的 ， 所 以 可 被 不 属于 该 类 的 方法 访问 和 操纵 ， 假 设 程序 员 
有 某 种 理由 要 这 样 做 。 一 个 更 现实 的 例子 (延续 前 面 的 棒球 示例 ) 可 见 图 10-7。 

.fie1d 汇 编 指令 允许 有 若干 个 其 他 的 访问 规范 和 参数 。 例 如 ， 一 个 域 可 声明 为 final， 意 
思 是 其 值 不 能 由 域 定义 中 设 定 的 值 所 改变 ， 也 可 以 声明 为 static， 意 思 是 该 域 与 一 个 类 而 不 是 
类 内 的 单个 对 象 相关 联 ， 

.field public static final double PI D = 3.1415926537898 

这 个 例子 将 包含 x 值 的 “PI” 定 义 为 静态 的 (面向 类 的 )、 最 终 的 (不 可 改变 的 ) 双 精 度 
数 。 如 果 由 于 某 种 原因 ， 程 序 员 想 要 限制 对 PI 的 使 用 只 能 是 该 类 内 部 的 方法 ， 就 可 将 其 声明 
为 private (私有 )。 有 效 的 访问 规范 包括 : 私有 (private)、 公 共 (public)、 保 护 (protected)、 
最 终 (final) 以 及 静态 (static) ， 它 们 在 Java 内 都 有 同样 的 意思 。 
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.field public Name Ljava/lang/String; 
,fie1d public Year I 
.field public Team Ljava/lang/String; 


.field public Games I 

.field public AtBats I 

.field public Runs I 

.field public Hits I 

.field public BattingAverage F 





图 10-7 假想 的 BaseballPlayer 类 的 域 ( 见 图 10-5) 


使 用 域 

由 于 域 自动 就 是 其 对 象 /类 的 组 成 部 分 ， 因 此 它们 作为 对 象 创建 的 组 成 部 分 (或 者 对 于 静 
态 域 ， 就 是 作为 类 加 载 的 组 成 部 分 ) 被 自动 创建 ， 而 且 当 相应 的 对 象 /类 通过 垃圾 收集 被 清理 
时 这 些 域 也 被 销毁 。 因 此 对 于 程序 员 来 说 ， 感 兴趣 的 两 个 操作 就 是 将 数据 存储 到 一 个 域 和 从 
域 中 取出 数据 (将 其 放 到 堆栈 上 )。 

存储 到 堆栈 的 过 程 类 似 于 存储 到 数组 的 过 程 ， 主 要 的 不 同 是 域 是 命名 的 而 不 是 编号 的 。 
这 样 ，putfie1d 操 作 就 接受 相关 域 的 名 字 作 为 参数 (因为 这 样 的 名 字 不 能 被 放置 到 堆栈 上 ) 。 
程序 员 需 要 压 人 相关 对 象 (其 域 将 要 被 设置 ) 的 地 址 以 及 (必须 是 正确 类 型 的 ) 新 值 ， 然 后 
执行 适当 的 putfie1d 指 令 ， 如 图 10-8 所 示 。( 执 行 代码 的 结果 显示 于 图 10-9) 。 


; #I 应 保存 BasebaT1P1ayer 类 的 一 个 实例 的 地 址 ( 即 “a') 
; 是 类 Examp1e 的 一 个 对 象 
; 明确 地 说 ， 是 Babe Ruth 


1dc "Babe Ruth" ; 压 人 人 名字， 该 名 字 将 被 置 于 Name 域 中 
putfield BaseballPlayer/Name Ljava/lang/String; 


aload_1 ; 重新 装 让 者 
; 将 1923 作 为 整数 放 入 到 域 中 
sipush 1923  ; 压 人 1923， 将 要 放 人 到 Year 域 中 
putfield BaseballPlayer/Year I ; 将 1923 作 为 整数 放 入 到 域 中 
aload_1 ; 重新 装 和 人 对 象 
]dc 0.393 ; 在 1923 年 ，Ruth 的 击 球 率 是 0.393 
putfie1d BaseballPlayer/BattingAverage 上 


; 将 0.393 作 为 浮 点 数 放 入 到 域 中 


aload_1 





图 10-8 在 对 象 域 中 存储 信息 


由 于 静态 类 属于 类 而 不 是 特定 的 对 象 ， 所 以 也 有 
类 似 的 结构 ， 但 不 需要 在 堆栈 上 有 一 个 对 象 ， 而 是 使 
用 putstatic 指 令 简 单 地 置 于 适当 的 类 域 中 。 如 果 前 
面 的 PI 例子 没有 被 定义 成 “final”， 那 么 程序 员 只 能 
通过 下 面 语句 调节 PI 的 内 部 值 : 


ldc_2w 3.6 ， 装 入 3.0， 成 为 PI 的 新 值 
putstatic Example/PI D ; 对 Examp1le 类 的 PI 置 为 3 


; 当然 ， 这 不 可 行 ， 因 为 PI 在 前 面 被 定义 成 “final 


JVM 还 提供 了 用 于 从 域 中 取 回 值 的 指令 
(getfie1d 和 getstatic)。System 类 (在 java.lang 中 
定义 ， 因 而 正式 地 表达 为 java/lang/System) 包含 一 个 





类 BaseballPlayer 

Name (String) Babe Ruth 
Year (1) 1923 
Team (String) 

Games (1) 

At Bats (1) 

Runs (1) 

Hits (1) 


Batting Average (下 ) 


图 10-9 执行 图 10-8 中 代码 的 结果 


静态 定义 的 名 为 out 的 域 ， 这 个 域 包含 一 个 printStream 对 象 。 要 得 到 这 个 对 象 的 值 ， 我 们 采用 
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下 面 已 经 熟悉 的 语句 ;: 
getstatic java/lang/System/out Ljava/io/PrintStream 
由 于 java/lang/System 是 一 个 类 ， 因 此 在 执行 getstatic 过 程 中 不 需要 堆栈 上 有 东西 ， 也 不 
会 弹出 任何 东西 。 当 访问 一 个 非 静态 域 (使 用 getfie1d) 时 ， 日 了 值 必 须 从 一个 特定 的 对 象 
中 选 出 来 ， 所 以 该 对 象 必须 首先 被 压 人 到 堆栈 ， 


aload_1 ; 从 #1 装 入 Examp1e 对 象 
getfield Example/AnExampleField I ， 将 AnExamp1erie1d 作 为 整数 压 入 


10.3.3 方法 

方法 介绍 

除了 域 ， 大 多 数 类 还 拥有 方法 ， 方 法 就 是 对 存储 于 类 或 其 对 象 中 的 数据 的 作用 方式 。 方 
法 与 域 的 不 同 之 处 在 于 方 靶 要 执行 计算 ， 因 而 包含 字 节 码 。 与 域 一 样 ， 有 若干 种 具有 不 同性 
质 的 方法 。 例 如 ， 主 要 的 方法 必须 几乎 总 要 定义 成 既是 public 的 又 是 static 的 ， 这 是 由 JVM 解 
释 器 工作 的 方式 所 要 求 的 。 当 JVM 试 图 执行 一 个 类 文件 时 ， 它 要 寻找 一 个 方法 来 执行 ， 该 方 
法 是 类 定义 的 一 部 分 (不 是 任何 特定 对 象 的 组 成 部 分 ， 因 为 静态 类 没有 对 象 )。 由 于 该 类 没有 
对 象 ， 这 个 方法 就 必须 可 公共 访问 。 由 于 这 个 原因 ， 我 们 迄今 所 写 的 每 个 程序 都 包括 下 面 一 
行将 main 定 义 成 public 和 static 方 法 : 

.method public static main([Ljava/lang/String;)V 

通过 invokevirtual 调 用 方法 

方法 在 其 相应 的 类 文件 中 声明 和 定义 。 要 使 用 一 个 方法 ， 就 必须 在 适当 的 对 象 或 类 .上调 
用 。 针 对 方法 调用 有 一 些 基本 的 方法 ， 这 些 方 法 根据 具体 情况 以 稍微 不 同 的 方式 使 用 。 

调用 方法 的 最 常见 和 最 直截了当 的 方式 就 是 使 用 invokevirtual 操 作 (操作 代码 为 0xB6) 。 
我 们 在 多 个 章节 中 一 直 在 使 用 这 种 方式 ,没有 特别 新 的 内 容 ， 概 念 上 也 不 困难 。 这 个 操作 从 
堆栈 弹出 一 个 对 象 ( 以 及 方法 的 参数 )， 调 用 对 象 上 的 适当 方法 ， 并 压 入 结果 ， 如 下 面 的 标准 
代码 所 示 : 

getstatic java/lang/System/out Ljava/io/PrintStream 


ldc “Hello, world!”" 
invokevirtual java/io/PrintStream/printin(Ljava/lang/String;)V 


这 段 代码 将 对 象 System.out (一 个 PrintStream) 和 一 个 参数 压 入 。 通 过 观察 
invokevirtual 这 一 行 ， 我 们 可 以 看 到 堆栈 顶部 必须 包含 一 个 java/lang/String 类 型 的 参数 ， 并 
在 其 下 包含 一 个 PrintStream 对 象 。 一 个 更 复杂 的 方法 可 能 要 接受 若干 个 参数 ， 但 参数 仍 要 在 
invokevirtual 这 一 行 指 定 ， 所 以 计算 机 能 确切 地 知道 要 弹出 多 少 个 参数 。 在 所 有 参数 之 下 就 
是 其 方法 将 要 被 调用 的 对 象 〈 见 图 10-10) 。 

当 调 用 这 个 方法 时 ， 控 制 将 以 与 子 例 程 调用 类 似 的 方式 传递 到 新 方法 。 然 而 ， 还 有 一 
些 极为 重要 的 差别 。 首 先 ， 到 方法 的 参数 被 顺序 地 置 于 从 #1 开始 的 局 部 变量 中 。 局 部 变量 
#0 得 到 的 是 其 方法 将 要 被 调用 的 对 象 本 身 的 一 个 拷贝 (用 Java 的 术语 ， 就 是 #0 得 到 this 的 
一 个 拷贝 )。 新 的 方法 还 得 到 全 新 的 一 组 局 部 变量 和 一 个 全 新 的 (并 且 是 空 的 ) 堆栈 。 

当 计 算 完成 后 ， 方 法 必须 有 返回 ， 并 且 以 方法 定义 所 期 望 的 适当 类 型 返回 。 从 调用 环境 的 
角度 看 ， 方 法 应 恋 向 堆栈 的 顶部 压 入 一 个 适当 类 型 的 元 素 。 从 方法 的 角度 看 ， 它 需要 知道 是 
哪个 元 素 (以 及 什么 类 型 )。 有 若干 个 命令 用 于 返回 ， 首 先是 不 返回 任何 东西 的 return， 即 其 


160 着 二 部 分 现实 矿 各 机 


aload 1 ; 装 和 人 类 C1ass 的 0bject 
bipush 3 

bipush 5 

ldac 5.0 

invokevirtual Class/method (IIF)V 





wt 
Ci 
维 机 
#0 : Object 
#1:3 
#2: 5 
#3: 5.0 


图 10-10 使 用 invokevirtual 调 用 方法 


类 型 是 void，?return 系 列 返回 堆栈 顶部 的 适当 类 型 的 元 素 。 这 个 系列 的 成 员 包括 ireturn、 
1return、freturn、dreturn， 以 及 用 于 返回 一 个 地 址 或 对 象 的 areturn ( 见 图 10-11)。 然 而 ， 
这 个 系列 不 包括 ret 指 令 ， 该 指令 是 从 一 个 子 例 程 返 回 。 在 方法 的 结尾 “离开 ”也 是 不 合法 的 。 
与 Java 和 大 多 数 高 级 语言 不 同 ， 在 方法 的 结尾 没有 隐 含 的 return。 

这 一 点 可 以 从 下 面 一 个 非常 简单 的 方法 中 看 出 来 ， 该 方法 当 且 仅 当 参数 是 整数 3 时 
返回 1。 

.method public isThree(I)I 


.1limit locals 2 
.limit stack 2 


iload_1 ; 参数 ， 是 一 个 整数 ， 在 #1 中 
bipush 3 ; 装 入 3， 为 了 比较 
if_icmpeq Yes ; 如 果 #1= =3， 则 返回 1 
bipush © ; 如 果 不 相等 ， 所 以 返回 0 
ireturn 

Yes: 
bipush 1 ; 相等 ， 所 以 返回 1 
ireturn 

.end method 


子 例 程 (通过 jsr/ret 访 问 ) 和 方法 (通过 invokevirtual/?return 访 问 ) 有 一 个 非常 重 
要 的 差异 。 当 一 个 子 例 程 被 调用 时 ， 调 用 环境 和 被 调用 例 程 共 享 局 部 变量 和 当前 堆栈 状态 。 
而 每 次 启动 一 个 方法 ， 你 就 得 到 一 组 全 新 的 〈 都 未 初始 化 的 ) 局 部 变量 和 一 个 全 新 的 〈 空 的 ) 
堆栈 。 由 于 每 次 新 的 方法 调用 都 得 到 一 个 新 的 堆栈 和 一 组 新 的 局 部 变量 ， 因 此 ， 方 法 以 一 种 
子 例 程 没有 的 方式 支持 递归 (方法 调用 自身 )。 要 递归 地 调用 方法 ， 可 以 简单 地 使 用 存储 在 #0 
中 的 值 作为 目标 对 象 ， 并 正常 地 写 invokevirtual 这 一 行 。 当 方法 执行 时 ， 它 将 使 用 其 自身 的 堆 
栈 和 局 部 变量 而 不 影响 主 计算 流程 。 当 从 方法 返回 时 ， 调 用 环境 可 简单 地 从 离开 的 地 方 重新 
运行 ， 并 使 用 方法 调用 的 返回 结果 。 


多 10 间 JVM 席 级 编程 问题 161 





bipush 6 
ldc 7.0 
bipush 1 


ireturn 


销毁 老 的 堆 术 | 。 泗 用 术 
| 6 | 硕 关 将 1 压 人 到 调 


用 帧 


图 10-11 采用 ireturn 的 方法 返回 
其 他 invoke? 指 令 
由 于 invokevirtual1 接 受 一 个 对 象 及 其 参数 来 调用 一 个 方法 ， 所 以 它 (或 许 是 显然 的 ) 不 
适 于 用 于 静态 方法 。 静 态 方法 没有 相关 的 对 象 。JVM 为 调用 类 上 的 静态 方法 提供 了 一 个 特殊 
的 invokestatic 操 作 (如 图 10-12 所 示 )。 这 个 操作 与 invokevirtual 非 常 类 似 ， 只 是 它 不 是 
试图 从 堆栈 弹出 一 个 对 象 ， 而 是 只 弹出 参数 。 它 不 用 操心 去 将 对 象 放 入 #0， 而 是 用 开始 于 #0 
的 参数 填充 到 局 部 变量 。 
<init> 
bipush 3 
bipush 5 
ldc 5.0 


invokestatic Class/staticmethod (IIF)Yy 


Ee 


新 的 
( 空 
堆 术 
#0: 3 
#1: 5 
#2: 5.0 


图 10-12 使 用 invokestatic 的 静态 方法 调用 


还 有 一 些 特殊 的 环境 需要 特殊 处 理 。 特 别 是 当 要 初始 化 一 个 新 的 对 象 (使 用 <init> 方 法 )， 
或 者 要 处 理 一 些 涉及 超 类 和 私有 (Private) 方法 的 棘手 情况 时 ， 就 必须 要 使 用 一 个 特殊 的 操 
作 invokespecial。 从 程序 员 的 角度 看 ，invokevirtual 和 invokespecial 之 间 没 有 差别 ， 但 
下 面 标准 样板 代码 说 明了 invokespecial 的 主要 用 途 。 
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.method public <init>QOYV 
aload_0 
invokespecial java/1ang/Object/<init>()V 
return 

.end method 


为 了 初始 化 一 个 (任意 类 的 ) 对 象 ， 首 先 有 必要 确认 它 有 超 类 的 所 有 性 质 (例如 ， 如 果 
Dog ( 狗 ) 是 Animal (动物 ) 的 子 类 ， 要 初始 化 一 个 Dog ， 你 就 需要 确认 它 是 一 个 合法 的 
Animal) 。 这 是 通过 调用 当前 对 象 (this， 或 者 局 部 变量 和 ) 上 的 初始 化 方法 来 完成 的 。 但 是 
由 于 它 是 一 个 初始 化 方法 ， 计 算 机 就 不 得 不 使 用 invokespecial。 

声明 类 

类 通常 在 具有 ,class 扩展 名 的 文件 中 定义 和 声明 。 所 以 ， 这 些 文件 就 包含 了 关于 类 本 身 及 
它们 与 其 他 类 之 间 关 系 的 必要 信息 ，JVM 需 要 这 些 信息 以 保证 操作 正确 。 

由 于 这 个 原因 ， 每 个 创建 的 类 文件 都 需要 有 两 个 汇编 指令 来 定义 类 本 身 及 其 在 类 层次 中 
的 位 置 ; | 


.Class Something 
-Super ParentOfSomething 


像 域 和 方法 一 样 ，.class 汇 编 指令 也 有 各 种 访问 规范 ， 如 public。 类 的 名 字 (在 上 面 例子 
中 的 Something) 应 该 是 完全 限定 名 ， 包 括 包 的 名 字 。 作 为 java.lang 包 的 一 部 分 定义 的 类 
System 就 包含 完全 限定 类 名 java/lang/System。 类 似 地 ， 超 类 应 该 包括 直接 超 类 的 完全 限定 名 ， 
而 且 必 须 出 现 。 虽 然 大 多 数学 生 写 的 类 都 是 java/lang/Object 的 子 类 ， 但 这 不 是 缺 省 的 ， 必 须 
明确 地 给 予 指定 。 

还 有 一 些 其 他 的 汇编 指令 在 类 文件 中 可 有 可 无 ， 多 数 是 用 于 源 程序 调试 的 汇编 指令 。 例 
如 ，.source 汇 编 指 令 告 诉 JVM 程 序 用 来 生成 类 文件 的 文件 的 名 字 。 如 果 程 序 在 运行 过 程 中 出 
错 ，JVM 解 释 器 能 使 用 这 个 信息 来 打印 更 多 有 用 的 错误 消息 。 


10.3.4 类 的 分 类 

在 上 一 节 讨 论 中 被 掩盖 的 一 个 重要 的 微妙 之 处 就 是 存在 若干 个 不 同类 型 的 类 文件 和 方法 。 
虽然 它们 都 非常 类 似 〈 在 存储 上 的 实际 差异 通常 只 涉及 设置 和 清除 类 文件 中 访问 标志 的 一 些 
位 )， 但 它们 代表 了 类 语义 方面 的 深刻 差异 ， 尤 其 是 从 类 的 外 部 来 看 。 

在 类 、 对 象 以 及 方法 之 间 的 最 通常 的 关系 中 ， 一 个 类 中 的 每 个 对 象 有 其 自己 的 一 组 数据 ， 
但 由 一 组 统一 的 方法 来 操作 。 例 如 ， 考 虑 任何 特定 型 号 汽车 的 “类 ”( 让 我 们 特别 考虑 2007 本 
田 雅 阅 )。 显 然 ， 这 些 汽 车 (在 理论 上 ) 以 相同 方式 操作 ， 但 它们 在 诸如 颜色 、 油 箱 油 量 以 及 
车 牌号 方面 有 各 自 的 性 质 。 这 些 性 质 在 各 个 Honda 对 象 中 被 存储 成 域 。 另 一 方面 ， 每 辆 车 的 车 
前 灯 都 用 绝对 同样 的 方式 控制 。 打 开车 前 灯 的 “方法 ”是 类 的 一 个 特性 ， 而 不 是 某 个 汽车 的 
特性 。 

然而 ， 存 在 其 些 作 为 类 总 体 上 的 性 质 ， 如 汽车 的 长 度 、 轴 上 距 宽度 以 及 油箱 尺寸 。 这 些 性 
质 甚至 能 直接 从 设计 图 中 读 出 ， 不 需要 汽车 实际 存在 。 我 们 对 两 个 概念 加 以 区 分 : 类 变量 
(class variable) 是 指 类 本 身 的 性 质 ， 而 实例 变量 (instance variable) 是 指 各 个 实例 的 性 质 。 
在 JVM 中 ， 类 变量 的 域 被 声明 为 static 并 被 存储 于 类 本 身 而 不 是 存储 于 各 个 对 象 : 

.field color Ljava/lang/String; 

.field static carLength D 

类 似 地 ， 域 可 被 定义 为 final 以 表示 其 值 (无 论 是 一 个 实例 变量 还 是 一 个 类 变量 ) 不 能 被 
改变 : 
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,field final vehicleIndentification Lijava/lang/String; = "whatever" 
.field static final wheels I = 4 
.Field static final tires 工 = 4 


在 这 个 例子 中 ， 域 vehicleldentification 是 一 个 不 变化 的 实例 变量 (但 不 同 汽车 的 值 可 
能 不 同 ) ， 而 这 个 类 中 的 所 有 汽车 都 有 相同 固定 不 变 的 轮子 数 ( 见 图 10-13)。 汽 车 的 长 度 是 读 
类 的 一 个 性 质 ， 而 汽车 的 颜色 是 各 个 汽车 对 象 的 性 质 并 可 变化 〈 比 如 你 决定 要 重新 喷漆 的 话 ) 。 


类 : Car 
静态 域 


wheels = 4 


tires = 4 





对 象 ; Carl 对 象 ，Car2 对 象 : Car3 


color = “red” color = “blue” color = “red” 


type = “coupe” type = “sedan” type = “convertible” 


VIN = xxxx VIN= yyyy VIN = zz2z 





图 10-13 类 与 静态 域 。 所 有 汽车 都 有 相同 数量 的 轮子 ， 但 每 个 都 有 其 自 己 的 颜色 和 车 牌号 (VIN) 


实例 方法 和 类 方法 之 间 有 类 似 的 区 别 。 迄 今 所 写 的 大 多 数 程序 都 包括 一 个 如 下 定义 的 
方法 : 

.method public static main([Ljava/lang/String;)V 

这 个 main 方 法 非常 重要 ， 因 为 默认 情况 是 : 一 旦 Java 程 序 运行 (或 者 更 准确 地 说 是 一 个 
类 文件 用 java 执 行 )，Java 程 序 就 装 入 该 类 文件 并 寻找 一 个 名 字 为 “main” 的 方法 。 如 果 找 到 ， 
就 试图 用 一 个 参数 来 调用 该 方法 ， 该 参数 对 应 于 从 命令 行 链 人 的 其 余 文 字 。static 关 键 字 指 
出 main 方 法 是 与 类 关联 ， 而 不 是 与 任何 的 类 实例 关联 。 因 此 ， 就 没有 必要 为 了 调用 main 方 法 
而 生成 适当 类 的 任何 实例 。 

此 外 ， 我 们 还 有 一 个 必要 的 性 质 “public”， 用 于 指明 该 方法 〈 或 ) 域 可 从 类 的 外 部 访问 。 
一 个 public 方 法 (或 类 ) 对 于 整个 系统 都 是 可 见 的 和 可 执行 的 ， 包 括 JVM 启 动 序列 ， 而 private 
方法 只 能 从 类 内 的 对 象 /方法 来 执行 。 这 在 “main” 本 身 的 结构 中 当然 是 隐 含 的 ， 因 为 它 作为 
整个 系统 的 第 一 个 方法 必须 是 可 执行 的 。 还 有 其 他 的 访问 标志 的 变型 可 以 像 前 面 将 类 、 域 
或 方法 定义 为 “final”， 或 者 甚至 定义 成 “abstract”， 意 思 是 类 本 身 只 是 一 个 抽象 ， 我 们 不 能 
从 中 生成 实例 ， 而 是 应 该 使 用 该 类 的 一 个 子 类 。 再 则 ， 这 些 方 法 和 性 质 的 细节 与 高 级 Java 程 
序 员 更 为 相关 ， 而 与 理解 JVM 本 身 如 何 工 作 关系 不 大 。 


10.4 对 象 


10.4.1 作为 类 的 实例 创建 对 象 
类 定义 本 身 对 于 完成 计算 通常 用 处 并 不 很 大 。 更 有 用 的 是 作为 对 象 的 这 些 类 的 实例 ， 也 
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就 是 类 的 具体 实例 ， 能 够 持 有 数据 、 调 用 方法 ， 以 及 做 有 用 的 事情 。 例 如 ， 前 面 在 记录 一 节 
定义 的 “fraction” 类 简单 地 定义 一 个 分 数 有 两 个 域 ， 分 子 和 分 母 。 一 个 实际 的 分 数 就 在 这 些 
域 中 有 特定 的 一 组 值 ， 可 用 于 实际 的 计算 。 

要 创建 一 个 类 的 实例 ， 首 先 必须 知道 类 的 名 字 。 请 见 如 下 的 jasmin 语 名 ， 

new ExampTeClassType 

该 语句 创建 了 ExampleClassType 类 的 一 个 新 的 实例 (在 计算 机 内 为 其 分 配 存 储 空间 ) ， 并 
将 一 个 地 址 压 人 到 方法 堆栈 ， 该 地 址 指向 这 个 新 的 对 象 。 仅 仅 分 配 空间 还 不 够 ， 还 必须 要 用 
为 该 类 型 定义 的 某 个 构造 方法 将 其 初始 化 到 一 个 有 用 和 有 意义 的 状态 。 要 做 到 这 一 点 ， 就 有 
必要 使 用 invyokespecial 并 提供 适合 的 方法 和 一 组 参数 ， 如 图 10-14 所 示 。 


; 示意 fraction 结 构 类 型 使 用 的 程序 


.class public fractionfront 
.super java/lang/Dbject 


.method public <init>OV 
aload_0 
invokespecial java/lang/Dbject/<init>()V 
return 

.end method 


.method public static main( [Ljava/lang/String;)V 


new fraction 
invokespecial fraction/<init>(O)V 


return 
.end method 





图 10-14 创建 一 个 fraction 对 象 


记 住 这 个 分 数 类 (采用 标准 的 样板 ) 定义 了 一 个 构造 方法 <init> ， 该 方法 不 接受 参数 。 因 
此 ， 我 们 构造 新 的 分 数 就 用 下 面 的 两 行 语句 来 完成 分 数 的 创建 和 初始 化 。 


new fraction 
invokespecial fraction/<init>OV 


实际 上 ， 这 并 不 士 分 有 用 。 其 原因 是 ， 虽 然 我 们 刚刚 创建 和 初始 化 对 象 ， 但 
invokespecial 指 令 在 返回 时 将 弹出 fraction 的 唯一 引用 。 结 果 ， 我 们 新 分 配 的 存储 块 会 丢 
失 ， 现 在 就 可 能 被 作为 垃圾 回收 。 为 了 保持 新 fraction 对 象 的 访问 ， 我 们 需要 在 调用 
invokespecial 之 前 复制 地 址 ， 如 图 10-15 所 示 。 这 个 图 还 给 出 了 如 何 将 数据 在 对 象 域 之 间 移 
动 的 例子 。 


10.4.2 销毁 对 象 
对 象 销 筑 也 由 垃圾 收集 系统 来 处 理 ， 并 可 在 指向 对 象 的 指针 不 再 处 于 可 访问 的 位 置 (如 
在 局 部 变量 中 或 在 堆栈 上 ) 时 进行 。 
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; 示意 'fraction' 结 构 类 型 使 用 的 第 二 个 程序 


.class public fractionfront2 
.Super java/lang/0bject 


; 样板 

.method public <init>()V 
aload.0 
invokespecial java/lang/0bject/<init> OV 
return 

.end method 


.method public static main( [Ljava/lang/String;)V 
‘limit locals 2 
‘limit stack 2 


; 生成 一 个 新 的 'fraction' 并 存储 到 局 部 变量 1 

new fraction ; 生成 一 个 新 的 'fraction' 
dup ; 复制 ， 以 便于 ca1T <init> 
invokespecial fraction/<init> (OV ; 初始 化 

astore_1 ; 存储 新 fraction 


; 将 分 子 赋值 为 2 

aload_1 ; 装 入 fraction 
iconst_2 ; 压 入 分 子 的 值 
putfield fraction/numerator I ; 将 2 置 于 分 子 ( 作 为 整数 ) 


; 请 注意 ， 不 需要 对 fraction 重 新 存储 


; 将 分 母 复制 为 3 

aload_1 ; 装 入 fraction (再 一 次 ) 
iconst_3 ; 压 入 分 母 

putfield fraction/denominator I ; 将 3 置 于 分 母 〔 作 为 整数 ) 


; 显示 分 子 

getstatic java/lang/System/out Ljava/io/PrintStreanm; 

aload_1 ; 装 人 fraction 

getfield fraction/numerator I ; 获得 和 压 人 分 子 
invokevirtual java/ioVPrintStream/print(I)V ; …… 并 显示 


; 显示 一 个 斜 线 

getstatic java/lang/System/out Ljava/io/PrintStream; 

ldc DAL 

invokevirtual java/io/PrintStream/print (Ljava/lang/String;)V 


; 用 print(1n) 显 示 分 母 

getstatic java/lang/System/out Ljava/io/PrintStream; 

aload_1 ; 装 人 fraction 

getfield fraction/denominator I ; 获得 和 压 入 分 母 

invokevirtual java/io/PrintStream/printin(I)V ; …… 并 用 print(1n) 显 示 


return 
.end method 





10-15 生成 和 使 用 fraction 对 象 
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10.4.3 类 型 对 象 

在 任何 JVM 系 统 中 ， 基 本 的 类 型 都 命名 为 “Object” ( 即 对 象 ) ， 或 者 更 全 面 地 说 是 
java/lang/Object。 作 为 整个 继承 体系 的 根 ， 系 统 中 的 一 切 都 是 某 种 形式 的 Object。 因 此 ， 
Object 的 特性 就 是 系统 中 所 有 一 切 所 共享 的 基本 性 质 ，Object 的 方法 是 可 被 所 有 对 象 调用 
的 方法 。 这 些 方法 因为 是 如 此 地 基本 ， 所 以 并 不 特别 有 意思 。 例 如 ， 所 有 的 Object 都 支持 
一 个 equals() 方 法 ， 该 方法 在 两 个 对 象 相 同时 返回 真 (“true”) ， 在 不 同时 返回 假 
(“false” )。 

由 于 通用 类 型 的 Object 可 用 作 一 般 的 数据 保存 器 ， 程 序 员 就 可 定义 (或 者 更 有 可 能 使 用 ) 
一 个 标准 化 的 List 类 型 ， 用 以 保存 一 组 Object。 然 后 ， 无 须 修改 就 可 用 这 个 类 型 来 保存 他 的 杂 
货 店 清单 、 课 表 、 他 最 喜爱 球 队 的 胜 败 记录 。 作 为 Java 语 言 的 一 部 分 ， 多 数 的 标准 数据 结构 
都 以 这 种 方式 定义 ， 使 得 其 中 存储 的 数据 〈 作 为 Object) 对 于 如 何 使 用 这 个 结构 没有 施加 任何 
限制 。 


10.5 类 文件 和 .class 文 件 结构 


10.5.1 类 文件 

在 一 个 典型 的 JVM 系 统 中 ， 每 个 独立 的 类 存储 在 一 个 类 文件 中 ， 类 文件 就 保持 了 该 特定 
类 的 使 用 和 执行 所 必要 的 信息 。 多 数 的 信息 是 显而易见 的 ， 例 如 ， 类 的 名 称 、 在 继承 层次 中 
与 其 他 类 的 关系 ， 以 及 类 所 定义 的 方法 和 类 的 特点 。 存 储 的 精确 细节 可 能 是 相当 技术 化 的 ， 
甚至 可 能 在 不 同 的 JDK 版 本 之 间 有 变化 。 所 以 ， 如 果 你 对 类 文件 格式 的 细节 有 专家 级 的 需求 
例如， 如果 你 正在 写 一 个 编译 器 ， 该 编译 器 输出 JVM 机 器 指令 ) ， 你 或 许 就 应 该 去 参考 一 本 
详细 的 技术 手册 ， 比 如 像 IVM 参 考 规范 2 。 对 于 非 专家 ， 下 面 的 描述 〈 以 及 附录 C 中 更 详细 的 
描述 ) 会 给 出 类 文件 的 一 些 特色 。 

一 般 来 说 ， 一 个 类 文件 存储 成 一 组 伐 套 的 表 ， 如 图 10-16 所 示 。 顶 娠 的 表 包 含 了 关于 类 
的 基本 信息 ， 如 JVM 编 译 的 版 本 号 、 类 名 ， 以 及 基本 的 访问 性 质 。 这 个 表 还 包含 一 组 子 表 ， 
包括 一 个 定义 了 方法 、 域 、 属 性 以 及 类 实现 的 直接 接口 子 表 。 另 一 个 子 表 包含 了 常量 池 
(constant pool) ， 常 量 池 存储 了 程序 所 使 用 的 基本 常量 值 和 字符 串 。 例 如 ， 如 果 类 每 次 需要 
的 值 是 3.1416 而 不 是 4 字 节 的 浮 点 值 本 身 ， 这 个 值 就 被 置 于 一 个 小 的 常量 表 中 ， 要 用 到 表 的 
索引 。 

这 就 有 提高 类 文件 空间 效率 的 效果 。 虽 然 程 序 可 用 的 不 同 浮 点 常数 超过 40 亿 的 ， 但 实 
际 上 几乎 很 少 有 程序 使 用 的 浮 点 常量 数 会 超过 100 左 右 。 一 个 只 有 200 个 条 目的 常量 池 可 用 
1 个 字 节 进行 索引 ， 因 而 每 个 常量 访问 就 节省 3 个 字 节 。 即 使 一 个 使 用 60000 个 常量 的 巨大 
程序 ， 用 2 字 节 索引 也 能 访问 任何 一 个 常数 。 除 了 存储 浮 点 常量 ， 常 量 池 还 保存 整数 、 长 
整数 、 双 精度 数 ， 甚 至 类 似 字符 串 (String) 常量 的 对 象 〈 像 提示 名 “Please enter your 
password (请 输入 密码 )”， 可 能 就 存储 起 来 ， 以 便 通过 调用 printin 打 印 ) 。 事 实 上 ， 我 们 
已 经 熟悉 的 1dc 操 作 实 际 上 就 代表 “从 常量 池 中 装 入 ”的 意思 ， 并 〈 如 我 们 可 看 到 的 ) 可 
用 于 几乎 任何 类 型 。 
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魔幻 数字 (4 个 字 节 ) OxCAFEBABE 
次 版 本 号 (2 个 字 节 ) 
主 版 本 号 (2 个 字 节 ) 
常量 池 数 (2 个 字 节 ) 


第 一 个 常量 池 入 口 
第 二 个 常量 池 入 口 


访问 标志 (2 个 字 节 ) 

该 类 (2 个 字 节 ) 指向 常量 池 入 口 

超 类 (2 个 字 节 ) 指向 常量 池 入 口 

接口 数 (2 个 字 节 ) 
第 0 个 接口 (2 个 字 节 ) 指向 常量 池 和 人口 
第 1 个 接口 (2 个 字 节 ) 指向 常量 池 入 口 


域 数 〈2 个 字 节 ) 
第 0 个 域 (变量 大 小 ) 
第 1 个 域 (变量 大 小 ) 


方法 数 (2 个 字 节 ) 
第 0 个 方法 (变量 大 小 ) 
第 1 个 方法 (变量 大 小 ) 


属性 数 (2 个 字 节 ) 
第 0 个 属性 (变量 大 小 ) 
第 I 个 属性 (变量 大 小 ) 





图 10-16 类 文件 格式 概览 


10.5.2 启动 类 

在 一 个 类 被 实际 运行 程序 使 用 之 前 ， 该 类 必须 被 从 磁盘 中 加 载 ， 链 接 成 可 执行 的 格式 ， 
并 最 终 初始 化 到 一 个 已 知 的 状态 。 这 个 过 程 是 JVM 程 序 必须 提供 的 基本 服务 之 一 ， 这 种 服务 
是 通过 原始 类 加 载 器 (primordial class loader) 的 形式 来 提供 的 ， 这 是 标准 定义 类 型 
java.]ang.C1assLoader 的 一 个 实例 化 。JVM 设 计 者 在 决定 原始 类 加 载 器 在 某 最 小 层次 上 能 
提供 什么 服务 方面 有 某 些 回旋 的 余地 。 

例如 ， 要 加 载 一 个 类 ， 加 载 器 通常 必须 能 在 局 部 存储 器 中 找到 这 个 类 (通常 通过 在 类 名 
字 的 后 面 加 上 .class 后 缀 ) ， 读 入 存储 的 数据 ， 并 生成 一 个 java.1ang.C1ass 的 实例 来 描述 这 个 
类 。 在 某 些 情况 下 (如 Web 浏 览 器 或 复杂 的 JVM 实 现 ) ， 可 能 需要 将 单个 类 从 归档 文件 中 去 除 
掉 ， 或 者 从 网 络 上 下 载 适 当 的 applet。 原 始 加 载 器 还 必须 对 类 结构 足够 了 解 ， 以 便 在 需要 时 去 
除 掉 超 类 。 如 果 你 写 的 类 扩展 了 Applet, 则 JVM 要 使 程序 正确 运行 就 需要 理解 Applet 及 其 特性 。 
将 这 些 不 同 的 类 链接 (link) 成 一 个 适当 的 运行 时 的 表示 则 是 链接 器 的 任务 (通常 也 结合 到 类 
加 载 器 中 )。 

JVM 类 加 载 器 的 另 一 个 重要 任务 是 验证 (verify) 字 节 码 执 行 是 安全 的 。 当 堆栈 上 没有 整 
数 时 ， 试 图 执行 一 个 整数 乘法 就 是 不 安全 的 。 试 图 对 不 存在 的 类 创建 一 个 新 对 象 也 是 不 安全 
的 。 验 证 器 负责 实施 本 书 讨论 的 大 多 数 安全 规则 。 最 后 ， 类 通过 调用 适当 的 例 程 来 初始 化 
(initialization) ， 将 静态 域 设 置 为 适当 值 ， 或 者 使 类 成 为 适合 执行 的 状态 。 
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10.6 类 层次 汇编 指令 


这 个 部 分 主要 是 属于 Java 类 层次 的 高 级 特性 ， 故 可 以 跳 过 而 不 会 影响 连续 性 。 

实际 上 ，JVM 提 供 的 严格 类 型 层次 会 有 一 些 问 题 。 由 于 每 个 子 类 只 能 有 一 个 超 类 ， 每 个 
对 象 (或 者 类 ) 就 最 多 只 继承 一 组 性 质 。 真 实情 况 很 少 如 此 简洁 明确 。 例 如 ， 一 个 相当 明显 
的 层次 性 就 是 标准 的 生物 学 上 的 分 类 。 狗 是 哺乳 动物 ， 因 而 也 就 是 将 椎 动物 ， 因 而 也 就 是 动 
物 ， 等 等 。 这 在 JVM 类 层次 中 可 容易 地 建立 模型 ， 就 是 使 狗 成 为 哺乳 动物 的 子 类 ， 依 此 类 推 。 
然而 ， 在 实际 中 狗 还 继承 了 宠物 类 的 很 多 特性 ， 不 仅 猫 、 仓 鼠 、 还 有 十 比 〈 一 种 鱼 )、 长 尾 小 
黯 赵 、 性 蜥 〈 但 不 包括 能 、 狂 豹 以 及 其 他 非 宠物 哺乳 动物 ) 等 也 与 狗 一 样 都 属于 这 一 类 。 所 
以 我 们 可 以 看 到 ， 无 论 宠 物 类 还 包括 什么 ， 它 都 跨越 了 标准 生物 学 的 界限 。 由 于 从 多 个 类 中 
继承 ， 也 就 没有 办 法 在 这 类 结构 中 创建 一 个 同时 是 哺乳 动物 和 宠物 的 类 (或 对 象 ) 。 

Java 和 JVM 通 过 接口 (interface) 机 制 提供 一 个 过 程 ， 以 保持 这 种 规则 性 。 接 口 就 是 一 个 
像 类 一 样 (事实 上 ， 它 存储 在 相同 格式 的 文件 中 ， 只 有 一 些 访问 标志 变化 ) 的 特殊 的 对 象 ， 
它 定义 了 一 组 性 质 〈 域 ) 和 函数 (方法 ) 。 对 象 永远 都 不 会 是 一 个 接口 的 实例 ， 对 象 实现 接口 
是 通过 明确 地 在 其 类 内 部 对 这 些 性 质 和 函数 进行 编码 来 完成 的 。 例 如 ， 可 能 除了 定义 宠物 的 
性 质 ， 还 需要 有 获得 名 字 和 拥有 者 的 函数 〈 假 设 这 些 是 有 字符 串 返回 值 的 方法 ) ， 也 就 是 确定 
名 字 和 拥有 者 的 适当 方法 。 接 口 永远 不 会 实际 地 去 定义 方法 的 代码 ， 而 是 定义 了 程序 员 所 要 
求实 现 的 方法 。 类 似 地 ， 虽 然 接口 能 定义 域 ， 但 作为 接口 的 一 部 分 所 定义 的 域 必须 是 静态 的 
(static) 和 最 终 的 〈final) ， 这 反映 出 一 个 对 象 永远 都 不 会 是 一 个 接口 的 实例 ， 这 样 也 就 没有 
因 实 现 域 所 能 得 到 的 存储 空间 。 

到 此 ， 一 个 熟练 的 程序 员 就 能 定义 狗 (Dog) 类 ， 使 得 其 继承 哺乳 动物 (Mammal) 类 ， 
因而 也 就 得 到 了 哺乳 动物 的 所 有 性 质 。 他 还 可 以 将 类 定义 成 “实现 ”了 宠物 (Pet) 接口 ， 这 
要 确保 他 为 Dog 类 所 写 的 方法 中 有 每 个 Pet 类 都 需要 的 某 些 方法 。 

程序 员 就 可 以 在 其 类 文件 中 不 仅 将 Mammal 类 定义 成 Dos 交 的 超 交 ， 还 为 实现 Pet 接口 做 了 
定义 。 这 就 要 涉及 如 下 的 一 个 新 的 汇编 指令 : 


.Class public Dog 
.Super Mammal 
.implements Pet 


Pet 接口 的 声明 和 使 用 与 写 一 个 常规 的 类 文件 非常 类 似 ， 但 有 两 个 主要 的 差异 。 首 先 ， 程 
序 员 不 是 使 用 .class 汇 编 指 令 来 定义 类 名 ， 而 是 以 相同 的 方式 使 用 .interface 汇 编 指令 : 

.interface public Pet 

其 次 ， 在 Pet. j 文 件 中 的 方法 会 有 方法 声明 但 却 没有 与 其 关联 的 实际 代码 ( 暗 指 方法 是 抽 
象 的 ) : 


.method public abstract getName()Ljava/lang/String; 
.end method 
.method public abstract getOwner OLjava/lang/String; 
-end method 


接口 类 型 和 类 类 型 的 用 法 之 间 还 有 一 些微 小 的 差异 。 首 先 ， 接 口 类 型 不 能 直接 作为 对 象 
创建 ， 虽 然 可 以 创建 实现 了 接口 类 型 的 对 象 。 在 上 面 的 例子 中 ， 虽 然 生成 一 个 Dog 是 合法 的 ， 
但 生成 一 个 Pet 却 不 是 合法 的 : 


new Dog ; 可 以 这 样 做 
new Pet ; 这 会 产生 一 个 错误 


然而 ， 接 口 可 作为 参数 类 型 接受 并 返回 方法 的 值 。 下 面 的 代码 将 接受 任何 实现 了 Pet 接口 
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的 有 效 对 象 : 

invokespecial Dog/isFriend1yTo(CLPet;)I 

该 代码 还 指出 ， 一 个 特定 的 Dog 是 否 与 一 个 特定 的 Iguana ( 晨 蜥 ) 是 友好 的 。 最 后 ， 如 果 
你 有 一 个 实现 了 特定 接口 的 对 象 ， 但 是 不 知道 类 是 什么 (就 像 上 面 isFrendlyTo 的 例子 ) ，JVM 
就 提供 一 个 基本 的 指令 invokeinterface， 使 得 接口 方法 能 直接 调用 而 无 需 考 虑 底层 类 是 什 
么 。invokeinterface 的 语法 类 似 于 其 他 的 invoke? 指 令 但 略 复杂 一 些 ， 通 常 也 比 其 他 方法 调 
用 指令 更 慢 和 更 低 效 。 除 非 你 对 接口 有 特定 的 需求 ， 最 好 还 是 由 专家 来 处 理 接口 问题 。 


10.7 注释 示例 :再 讨论 Hello, World 
到 此 ， 我 们 就 可 以 对 第 一 个 jasmin 例 子 (包括 样板 ) 给 出 一 个 详细 的 解释 了 ， 


.Class public jasminExample 

是 一 个 类 汇编 指令 ， 指 定 了 当前 类 的 名 字 。 

.Super java/lang/Object 

指出 其 在 标准 层次 体系 中 的 位 置 (上 明确 地 ， 是 一 个 java/lang/Object 子 类 )。 

.method public <init>OYV 

这 是 构造 一 个 jasminExample 类 型 元 素 的 方法 。 它 不 接受 参数 ， 无 返回 值 ， 名 为 <init>。 

10ad_0 

Tnvokespecial java/lang/Object/<init>OV 

这 初始 化 了 一 个 jasminExample， 我 们 装 入 例子 本 身 并 确保 其 首先 成 功 地 作为 一 个 对 象 初 
始 化 。 

return 

无 需 其 他 初始 化 步骤 ， 所 以 退出 该 方法 。 

.end method 

这 条 汇编 指令 结束 了 方法 的 定义 。 

-method public static main([Ljava/iang/String;)V 

这 是 主 方法 ， 由 Java 程 序 本 身 调用 。 它 接受 一 个 参数 ， 即 一 个 字符 数组 ， 不 返回 任何 值 。 
这 个 方法 定义 成 公共 的 和 静态 的 ， 所 以 可 从 类 的 外 部 调用 而 无 需 存在 该 类 的 任何 对 象 。 

.limit stack 2 

我 们 需要 两 个 堆栈 元 素 (一 个 用 于 System.out， 一 个 用 于 String)。 

getstatic java/lang/System/out Ljava/io/PrintStream; 
从 系统 类 中 获得 名 为 “out” 的 (静态 ) 域 。 它 的 类 型 应 该 是 PrintStream ， 在 java.io 包 中 
定义 。 

1dc "This is a sample program.” 

将 要 打印 的 字符 串 压 和 人 (更 准确 地 说 ， 将 常量 池 中 字符 串 的 索引 压 入 )。 

invokevirtual java/io/PrintStream/printin(Ljava/lang/String;)V 

在 System.out 调 用 “println” 方 法 。 

return 

退出 这 个 方法 。 


.end method 


这 条 汇编 指令 结束 了 方法 的 定义 。 
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10.8 输入 和 输出 ;一 个 解释 


10.8.1 问题 描述 

除了 语言 本 身 的 语法 ，Java 编 程 语言 还 定义 了 更 多 的 方面 。 语 言 被 接受 并 得 到 广泛 使 用 
的 关键 是 存在 各 种 软件 包 ， 用 以 处 理 编 程 中 不 同方 面 的 困难 问题 ， 如 输入 和 输出 。 例 如 ， 
java.io 就 是 特别 为 处 理 系统 输入 和 输出 而 设计 的 一 组 软件 包 ， 该 包 的 处 理 是 在 足够 抽象 的 层 
次 上 ， 因 而 可 以 在 不 同 的 平台 上 移植 。 

使 用 输入 和 输出 外 设 常常 是 任何 计算 机 程序 的 最 困难 部 分 之 一 ， 尤 其 是 在 汇编 语言 编程 
中 。 其 原因 简单 地 说 就 是 存在 各 种 令 人 困惑 的 设备 及 其 多 样 的 工作 方式 。 

至 少 在 理论 上 ， 像 磁盘 驱动 器 这 样 全 部 输入 在 任何 时 候 都 可 得 到 的 设备 ， 与 像 网 络 卡 这 
样 数 据 只 在 特定 时 间 和 受 限 条 件 下 得 到 的 设备 有 很 大 的 不 同 。 不 仅 有 不 同 种 类 的 设备 ， 即 使 
是 在 一 个 大 的 种 类 内 部 ， 也 有 一 些微 妙 但 重要 的 差异 ， 如 键盘 上 按键 的 布局 、 是 否 有 第 二 个 
鼠标 键 ， 等 等 。 然 而 ， 从 程序 员 的 角度 看 ， 这 些 差异 不 仅 不 重要 ， 而 且 会 导致 混乱 。 举 个 例 
子 , 一 个 电子 邮件 程序 的 主要 工作 是 从 用 户 那 里 读 入 ， 得 出 该 邮件 要 发 往 哪 里 ， 并 发 送 邮 件 。 
数据 如 何 到 达 的 细节 (比如 ， 是 通过 一 个 以 太 网 连接 达到 吗 ? 是 通过 键盘 按键 的 一 次 敲 击 
吗 ? 是 通过 一 个 剪 切 和 粘贴 操作 来 得 到 大 块 数据 吗 ? 是 作为 硬盘 上 的 一 个 文件 得 到 吗 ? ) 对 
于 电子 邮件 程序 是 (也 应 该 是 ) 无 关 紧 要 的 。 

遗憾 的 是 ， 在 基本 的 机 器 指令 级 ， 这 些 差 异 可 能 是 至 关 重 要 的 。 从 以 太 网 卡 读数 据 与 从 
磁盘 或 从 键盘 读数 据 不 是 一 回 事 。( 像 JVM 所 支持 的 ) 基于 类 的 系统 的 优势 是 类 本 身 可 被 操纵 
和 统一 ， 使 得 程序 员 的 任务 变 得 不 那么 混乱 。 


10.8.2 两 个 系统 比较 

一 般 外 设 问 题 

为 了 说 明 这 种 混乱 ， 考 虑 读 人 数据 并 将 其 打印 到 某 处 〈 到 屏幕 或 磁盘 ) 这 样 一 个 任务 。 
为 简化 ， 假 设 输入 设备 数据 的 进入 点 ) 是 一 个 配属 的 键盘 或 磁盘 。 不 用 细 解 释 ， 键 盘 就 是 
一 个 复杂 的 开关 。 当 一 个 键 被 按 下 时 ， 就 产生 某 个 电 连 接 ， 使 得 计算 机 能 确定 当时 哪个 键 被 
按 下 了 (因此 也 就 能 确定 按 的 是 哪个 字符 )。 磁 盘 是 一 个 信息 存储 设备 。 从 逻辑 上 看 ， 你 可 以 
将 它 想 象 为 巨大 的 一 组 “ 扇 区 (sector)”， 每 个 扁 区 存 有 固定 数量 的 字 节 (通常 是 512 个 字 节 ， 
但 也 不 总 是 这 样 ) 。 事 实 上 ， 还 更 复杂 一 点 ， 因 为 信息 被 排序 成 多 个 一 组 多 盘 片 (platter) (每 
个 盘 片 看 起 来 就 像 一 个 由 磁带 制 成 的 CD) ， 每 个 盘 片 有 若干 个 编号 的 同心 磁道 〈track) ， 每 个 
磁道 被 划分 成 若干 个 像 比萨 切片 一 样 的 扇 区 (sector) ( 见 图 10-17)。 要 读 或 写 一 个 扁 区 的 数 
据 ， 计 算 机 需要 知道 盘 片 号 、 磁 道 号 以 及 磁道 内 的 扇 区 号 。 但 大 多 数 时 间 硬 盘 驱 动 控制 器 会 
处 理 这 些 问 题 。 

注意 这 两 种 设备 之 间 有 一 些 重要 的 关键 区 别 。 首 先 ， 当 从 键盘 读 时 ， 由 于 只 能 知道 在 某 时 
刻 正在 按 下 的 键 ， 你 就 最 多 只 能 得 到 一 个 字符 的 信息 。 与 此 相反 ， 从 磁盘 读 却 能 同时 给 你 一 个 
启 区 的 信息 。 在 磁盘 上 还 可 以 向 前 读 以 发 现下 一 个 扇 区 装 的 是 什么 ， 而 这 对 于 键盘 是 不 可 能 的 。 

虽然 我 们 要 打印 到 屏幕 的 精确 细节 不 同 ， 但 都 存在 类 似 的 差异 。 如 果 在 计算 机 上 正在 运 
行 一 个 窗口 管理 器 ， 我 们 当然 就 要 打印 到 独立 的 窗口 中 而 不 是 像 文 本 模式 那样 打印 到 屏幕 上 。 
例如 ， 在 文本 模式 中 ， 我 们 总 是 知道 打印 要 从 实际 屏幕 的 左边 开始 ， 但 我 们 完全 不 知道 某 个 
时 刻 窗口 在 哪里 。 我 们 试图 打印 时 ， 窗 口 其 至 在 移动 。 因 此 ， 根 据 前 面 所 定义 的 结构 ， 打 印 
到 屏幕 与 向 磁盘 写 数据 全 然 不 是 一 回 事 。 
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盘 片 或 盘面 柱 面 或 磁道 记 区 
图 10-17 磁盘 的 结构 


我 们 将 会 看 到 ，JVM 通 过 使 用 一 个 适当 的 类 结构 而 避免 了 很 多 混乱 。 它 使 用 的 类 结构 不 
同 于 另外 一 种 常用 的 系统 ， 就 是 可 使 用 Windows 98 的 英特尔 奔腾 系统 。 

英特尔 奔腾 系统 

附 到 奔腾 系统 的 每 个 设备 都 带 有 一 套 设 备 驱动 器 (device driver)。 事 实 上 这 对 于 每 个 计 
算 机 都 是 如 此 。 驱 动 器 定义 了 如 何 与 硬件 交互 作用 。 在 这 一 点 上 驱动 器 与 类 和 方法 类 似 ， 除 
了 没有 有 用 的 统一 接口 。 任 何 Windows 系 统 都 有 的 最 简单 的 一 组 设备 驱动 器 就 是 BIOS (基本 
输入 输出 系统 )， 作 为 操作 系统 的 组 成 部 分 发 售 。( 实 际 上 ，BIOS 比 奔腾 提前 近 20 年 就 发 售 ， 
但 来 自 于 IBM-PC 的 顽固 影响 仍 在 起 作用 )。 

在 英特尔 奔腾 机 上 ， 用 一 条 机 器 指令 (INT) 将 控制 传递 给 BIOS。 当 这 条 指令 执行 时 ， 
计算 机 检查 存储 在 特定 位 置 《AX 寄存器 ) 的 值 ， 以 确定 应 该 做 什么 。 如 果 存 储 的 值 是 0x7305， 
计算 机 将 访问 附加 的 磁盘 。 为 了 正确 地 做 这 件 事情 ， 它 还 检查 一 些 存储 在 其 他 寄存 器 中 的 值 。 
这 些 值 包括 : 感 兴趣 的 磁盘 扁 区 号 、 放 置 新 数据 的 存储 位 置 、 从 磁盘 读 还 是 向 磁盘 写 。 在 任 
何 一 种 情况 下 ， 都 至 少 要 传递 一 个 扁 区 的 数据 。 

如 果 存 储 在 AX 寄 存 器 中 较 低 半 部 分 的 值 是 0x01， 则 这 条 将 控制 传递 到 BIOS 的 指令 还 导 
致 计算 机 读 一 个 字符 。 实 际 上 ， 这 个 过 程 更 复杂 一 些 。 如 果 存 储 的 值 是 0x01， 计 算 机 将 等 待 
直到 一 个 按键 被 按 下 并 返回 那个 字符 (还 将 字符 打印 到 屏幕 上 )。 如 果 存 储 的 值 是 0x06， 则 计 
算 机 就 检测 这 时 是 不 是 有 按键 被 按 下 ， 并 返回 它 (不 用 打印 )。 如 果 没 有 按键 被 按 下 ， 则 不 返 
回 任何 东西 (并 将 一 个 特殊 标志 置 位 以 指明 这 一 点 )。 这 两 个 功能 都 是 一 次 只 读 一 个 字符 。 要 
一 次 读 几 个 字符 ， 且 这 些 字符 在 超前 敲 和 人 缓冲 器 中 可 得 到 的 话 ， 就 使 用 存储 值 0x0A ， 该 功能 
不 返回 字符 ， 而 是 将 它们 存储 到 主 存储 器 。 

输出 有 类 似 的 细节 问题 。 要 向 磁盘 写 ， 你 就 要 使 用 与 读 人 时 同样 的 操作 ， 而 在 文本 模式 
或 窗口 系统 下 写 到 屏幕 需要 两 种 不 同 的 操作 (与 读 操作 / 值 不 同 )。 

所 有 这 些 都 发 生 在 设备 驱动 器 和 硬件 控制 器 已 经 “简化 ”了 访问 外 设 的 任务 以 后 。 根 本 
的 问题 是 各 种 硬件 相互 之 间 差 异 太 大 。 程 序 员 可 以 写 出 一 个 有 特殊 用 途 的 函数 ， 比 如 ， 针 对 
输入 完成 这 样 的 工作 : 如果 输入 要 从 键盘 读 入 ， 就 使 用 操作 0x01， 如 果 要 从 磁盘 读 和 人 人， 就 使 
用 操作 0x7305， 在 任何 一 种 情况 下 ， 都 将 值 以 统一 的 格式 移动 到 统一 的 位 置 。 这 样 的 程序 写 
起 来 或 易 或 难 ， 但 需要 对 细节 的 关注 、 硬 件 知识 ， 以 及 不 是 每 个 程序 员 都 愿意 花费 的 时 间 。 
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这 种 混乱 就 是 为 什么 Windows 操 作 系统 存在 的 部 分 原因 。Windows 的 部 分 功能 就 是 为 程序 
员 提供 了 粗 线条 的 接口 。 微 软 的 程序 员 已 经 花 时 间 编写 了 这 些 考虑 了 各 种 情况 的 详细 函数 。 

JVM 

与 此 形成 对 照 的 是 ， 在 一 个 适当 设计 和 构造 的 基于 类 的 系统 中 ， 这 种 统一 是 通过 类 结构 
本 身 来 达到 的 。 在 Java (以 及 在 JVM 的 扩展 ) 中 ， 大 多 数 的 输入 和 输出 都 是 由 类 系统 来 处 理 
的 。 这 就 使 得 类 能 够 处 理 信息 隐藏 并 只 通过 方法 给 出 重要 的 共享 性 质 。 

简要 回顾 一 下 :java.io.* 包 是 为 Java 1.4 定 义 的 ， 它 提供 了 多 种 类 ， 每 个 类 都 有 不 同 的 性 
质 用 于 读 和 写 。 用 于 输入 的 最 有 用 的 、 也 是 最 常用 的 类 就 是 BufferedReader。 这 是 一 个 相当 
强大 的 高 级 别 的 类 ， 能 读 入 很 多 种 一 般 化 的 “ 流 ” 对 象 ( 见 图 10-18) 。Java 的 1.5 版 本 还 包括 
了 一 些 附加 的 类 ， 如 Sanner ， 也 以 类 似 的 方式 处 理 。 


磁盘 上 的 文件 
< “When in the course of 


Ce human events...” 
2 


| 读 出 的 块 


BufferedReader “When in the course of 
| | | | wor 
“WW” “sh” “pe”” “on” 


读 字符 的 Java 程 序 “WW” 


图 10-18 使 用 BufferedReader 从 磁盘 读 和 一 个 文件 


遗憾 的 是 ， 键 盘 缺 乏 这 些 BufferedReader 对 象 的 很 多 典型 特性 ， 但 类 系统 提供 了 一 种 方式 
从 其 他 种 对 象 来 构造 一 个 BufferedReader 对 象 。 标 准 的 Java 库 确实 提供 了 一 个 对 象 ， 这 是 
System 类 的 域 ， 称 为 Syatem.in， 通 常 关联 到 键盘 。 然 而 ， 这 个 域 被 定义 成 保存 最 低级 、 最 原 
始 的 类 型 的 输入 对 象 之 一 ， 即 一 个 java.io.InputStream。 (InputStream 与 BufferedReader 之 间 的 
关键 差异 包括 缺乏 缓冲 和 除了 字 节 数组 不 能 读 其 他 任何 类 型 ) 。 

java.io.* 包 还 提供 了 一 个 特殊 的 类 型 用 于 从 磁盘 读 ， 无 论 是 作为 一 个 FileInputStream 还 是 
作为 一 个 FileReader， 两 者 都 可 用 于 构造 一 个 BufferedReader。 一 有 旦 完成 这 件 事 ， 访 问 文件 就 
等 同 于 访问 键盘 ， 因 为 两 者 都 使 用 与 BufferedReader 类 相同 的 方法 。 

在 下 一 节 中 ， 我 们 将 (采用 更 广泛 可 用 的 Java 1.4 语 义 ) 构造 一 个 程序 ， 实 现 的 功能 是 : 
从 键盘 读 和 一行 ， 并 将 该 行 拷贝 到 标准 输出 。 虽 然 该 过 程 仍 复杂 ， 但 复杂 性 在 于 
BufferedReader 的 构造 上 而 不 是 在 实际 的 数据 读 过 程 。 对 于 对 象 构造 的 简单 的 一 次 性 代价 ， 任 
何 数 据 都 可 通过 BufferedReader 来 读 ， 而 在 英特尔 上 相对 应 的 程序 则 对 每 个 输入 /输出 操作 都 
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需要 考虑 特殊 情况 和 魔幻 数字 。 


10.8.3 示例 ， 在 JVM 中 从 键盘 读 入 

在 Java 中 执行 这 个 任务 的 代码 例子 在 图 10-19 中 给 出 。 注 意 需 要 两 个 转换 ， 首 先是 从 
InputStream 构 造 一 个 InputStreamReaderi 其 次 是 从 InputStreamReader 构 造 一 个 
BufferedReader。 事 实 上 ， 在 Java 代 码 中 甚至 还 隐藏 了 一 点 复杂 性 ， 因 为 实际 的 
BuftferedReader 构 造 国 数 是 这 样 定 义 的 ， 

public BufferedReader(Reader in) 

意思 是 可 从 任何 种 类 的 Reader 来 构造 BufferedReader ，JnputStreamReader 只 是 其 一 个 子 类 。 

如 前 所 述 ， 对 象 的 构造 是 通过 两 个 步 又 完成 的 。 首 先 ， 必 须 创建 这 个 新 的 对 象 本 身 ( 通 
过 new 指 令 )， 然 后 必须 调用 适当 的 初始 化 方法 (通过 invokespecia1)。 这 个 程序 需要 创建 两 
个 新 的 对 象 ， 一 个 是 InputStreamReader， 一 个 是 BufferedReader。 一 旦 创建 了 这 两 个 对 象 ， 
BufferedReader 类 定义 的 一 个 标准 方法 ( 称 为 “readline”) 就 从 键盘 读 一 行 并 将 其 作为 String 
返回 〈Ljava/lang/String;)。 采 用 这 种 方法 ， 我 们 就 能 得 到 一 个 串 并 通过 System.out 的 println 方 
法 照常 打印 。 


import java.io.*; 


class jvmReaderExample 1 
public static void main(String[] args) throws IDException { 


InputStreamReader i = new InputStreamReader(Systenm.in); 
BufferedReader b = new BufferedReader(i); 


String s = b.readLine(); 
System.out .println(s); 





图 10-19 从 键盘 读 入 一 行 并 显示 的 Java 样 例 程序 


10.8.4 解答 


-Clas8 public jvmReader 
-SUPer java/lang/OQbject 


; 对 象 创建 所 需 的 样板 

.method public <init>()V 
aload_0 
invokespecial java/lang/0bject/<init>OV 
return 

.end method 


.method public static main([Ljava/lang/String;)V 


.limit stack 4 


; 创建 一 个 新 的 InputStreamReader 类 型 的 对 象 
Dew java/io/InputStreamReader 


; 从 System.in (InputStreamReader) 初始 化 构造 函数 
dup 
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getstatic java/lang/System/in Ljava/io/InputStream; 

invokespecial java/io/InputStreamReader/<init> (Ljava/io/InputStream;)V 
; 等 价 于 new InputStreamReader(InputStream) 

; 现在 创建 一 个 新 的 BufferedReader 


new java/io/BufferedReader 


; 复制 ， 并 将 其 置 于 InputStreamReader 之 下 
dup_x1 


; 再 次 复制 ， 并 将 其 置 于 InputStreamReader 之 下 
dup_xi 


; 堆栈 现在 保存 着 BR、BR、ISR、BR 
; 消除 不 需要 的 BufferedReader 
pop 


; 使 用 InputStreamReader 调 用 BufferedReader 的 构造 函数 
invokespecial java/io/BufferedReader/<init>(Ljava/io/Reader;)V 


; 初始 化 的 BufferedStreamReader 现 在 就 在 堆栈 顶部 
; 调用 read]ine 方 法 得 到 一 个 串 (并 在 堆栈 顶部 离开 ) 


invokevirtual java/io/BufferedReader/readLine()Ljava/lang/String; 


; 得 到 System.out 

getstatic java/lang/System/out Ljava/io/PrintStream; 

swap 

invokevirtual java/io/PrintStream/println(Ljava/lang/String;)V 


return 
.end method 


10.9 示例 : 通过 递归 求 阶乘 


10.9.1 问题 描述 
作为 最 后 一 个 例子 ， 我 们 给 出 在 JVM 上 使 用 类 系统 完成 递归 ( 即 函数 或 方法 调用 其 自身 ) 
的 代码 。 递 归 浮 数 是 在 组 合 学 和 概率 论 中 广泛 使 用 的 数学 操作 。 例 如 ， 如 果 某 人 想 知道 洗 一 
副 52 张 的 牌 有 多 少 种 不 同 的 方式 ， 答 案 就 是 52! ,也 就 是 52 x 51 x … x 1。 阶 乘 的 一 个 很 好 的 
性 质 就 是 有 一 个 简易 的 递归 定义 ， 即 : 
NI=N. (N 一 1)! 对 于 Nz>z1， 且 01 =1 
采用 这 个 公式 ,我们 就 可 构造 一 个 递归 的 方法 ， 就 受 整数 N 并 返回 N1。 


10.9.2 设计 
解决 这 个 间 题 的 方法 很 简单 ， 可 作为 一 年 级 编程 教科 书 的 一 个 例子 : 


To calculate N! 
if (CN <= 0)] then 
return 1 
else begin 
recursively calculate (N-1)! 
multiply by N to get N * (N-1)! 
return N * (CN-1)! 
end 
end calculation 
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(严格 的 数学 家 会 指出 ， 这 个 伪 代 码 还 将 负数 的 阶乘 定义 为 1) 。 

此 外 ， 还 需要 一 个 〈 公 共 的 、 静 态 的 ) 主 例 程 来 设置 N 的 初 值 并 打印 最 终结 果 。 由 于 该 主 
方法 是 静态 的 ， 所 以 如 果 阶 乘 方法 不 是 静态 的 ， 就 需要 创建 适当 类 的 一 个 对 象 实例 。 如 果 我 
们 将 阶乘 方法 定义 成 静态 的 ， 就 可 直接 调用 它 。 


10.9.3 解答 
这 里 给 出 了 计算 51 的 解 。 可 用 类 似 的 代码 求解 几乎 任何 递归 定义 的 问题 。 


‘class public factorialCalculator 
-Super java/lang/D0bject 


; 对 象 创建 所 需要 的 样板 
.method public <init>()V 
aload_0 


invokespecial java/LIang/0bject/<init>()V 
return 
.end method 


.method public static main( [Ljava/lang/String;)V 


; 我 们 需要 两 个 堆栈 元 素 ， 一 个 用 于 System.out， 一 个 用 于 String 
.imit stack 2 


bipush 5 ; 压 和 3， 以 计算 51 
invokestatic factorialCalculator/fact (I)T 
; 5! 现 在 就 在 堆栈 上 计算 出 来 


; 得 到 和 压 人 System.out 
getstatic java/lang/System/out Ljava/io/PrintStrean; 


; 以 准确 的 次 序 输出 Systen .out 和 51 


swap 


; 调用 PrintStream/print1n 方 法 
invokevirtual java/io/PrintStream/println(I)V 


return 
-end method 


-method static fact(I)I 
.limit stack 2 
iload._0 ; 检验 是 否 参 数 <0 
ifle Exit ; 如 果 这 样 ， 立 即 返 回 1 


iload_0 ; 压 人 N 

iinc 0 -1 ; 计算 (N 一 1) 
iload_0 ; 装 入 (N 一 1) 
; 计算 (N 一 1) 1 


invokestatic factorialCalculator/fact (I)I 


; N 和 (N 一 1) 都 在 堆栈 上 


imul ; 相 乘 ， 得 到 最 终 答案 

ireturn ; 并 将 答案 返回 
Exit: 

iconst_1 ; 0! 定 义 为 1 

ireturn 


.end method 
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10.10 本 章 回 顾 


“JVM 由 于 其 与 面向 对 象 编程 语言 Java 的 紧密 关联 ， 为 面向 对 象 编程 和 用 户 定义 类 的 类 型 
提供 了 直接 的 支持 。 对 数组 和 对 象 的 引用 均 由 基本 类 地 址 所 支持 。 

“ 一 个 数组 是 由 一 个 整数 或 多 个 整数 所 索引 的 一 组 相同 类 型 数据 的 集合 。 有 独立 的 机 器 级 
指令 来 创建 、 读 、 写 一 维和 多 维 数组 ， 还 可 以 获得 数组 的 长 度 。 

* 当 数组 (或 任何 数据 ) 不 再 有 用 或 可 访问 时 ，JVM 将 自动 通过 垃圾 收集 来 回收 所 使 用 的 
内 存 ， 并 使 其 可 重用 。 

* JVM 还 支持 记录 ( 带 名 字 的 域 的 集合 ) 和 类 (定义 了 访问 方法 的 记录 )， 并 支持 接口 
(抽象 方法 的 集合 )。 类 文件 是 JVM 程 序 存储 的 基本 单位 ， 它 结合 了 所 有 这 三 种 类 型 。 

* 域 通过 getfie1d 和 putfield 指 令 来 访问 。 静态 (类 ) 域 用 getstatic 和 putstatic 来 访问 。 
* 类 通过 4 种 invoke? 指 令 之 一 进行 访问 ， 具 体 使 用 哪 种 取决 于 类 和 所 涉及 的 方法 。 

* 对 象 是 作为 类 的 实例 由 new 指 令 创 建 的 。 每 个 类 必须 包括 一 个 适当 的 构造 函数 (典型 地 
命名 为 <init>) ， 用 来 将 新 实例 初始 化 为 有 效 值 。 

“在 JVM 上 通过 I/O 原 语 访问 外 部 世界 是 通过 一 组 标准 化 的 类 和 方法 完成 的 。 例 如 ， 
System.in 是 一 个 InputStream 类 型 的 静态 域 ， 其 特性 和 访问 方法 由 标准 文档 定义 。 从 键盘 
读 可 以 用 System.in 作 为 一 个 基 类 ， 通 过 调用 特定 的 方法 和 创建 特定 的 类 来 完成 。 

。 使 用 类 系统 也 可 支持 递归 ， 这 可 通过 在 每 次 新 的 方法 调用 时 生成 一 组 新 的 局 部 变量 来 实 
现 。 这 不 同 于 以 前 的 jsr/ret 技 术 ， 也 不 同 于 像 奔 腾 或 PowerPC 所 采用 的 在 堆栈 柜上 创 
建新 的 局 部 变量 的 技术 。 


10.11 习题 


DW 一 


.JVM 的 用 户 定 义 类 型 与 其 他 机 器 如 8088 或 PowerPC 在 实现 方面 有 哪些 不 同 ? 
.在 PowerPC 上 如 何 为 一 个 局 部 数组 创建 空间 ? 该 空间 如 何 回收 ? 在 JVM 上 做 法 有 何不 同 ? 
.在 典型 的 计算 机 如 奔腾 上 ， 数 组 元 素 通常 是 通过 索引 模式 来 访问 的 。 在 JVM 上 采用 的 是 什 


么 方法 ? 

像 String.toUpperCase() 这 样 的 标准 方法 是 如 何 结合 到 JVM 中 的 ? 
域 与 局 部 变量 有 何不 同 ? 
invokevirtual 与 invokestatic 有 何不 同 ? 

为 什么 静态 方法 比 非 静态 方法 少 需要 一 个 参数 ? 


人 


. 与 下 列 方法 对 应 的 类 型 字符 串 是 什么 ? 


. foat toFloat(int) 

,void printString(String) 

. float average(int, int, int, int) 
. float average(int []) 

. double [J][} convert(ong {][]) 
. boolean isTrue(boolean) 


9. 关 于 <init> 方 法 有 什么 特殊 的 地 方 ? 
10. 每 个 类 文件 〈 见 附录 D) 中 第 4 个 字 节 是 什么 ? 
11. 一 个 方法 能 使 用 的 不 同 字符 串 值 大 约 有 多 少 ? 
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10.12 编程 习题 


写 一 个 jasmin 程 序 ， 采 用 Java 1.5 的 Scanner 类 从 键盘 读 入 一 行 并 同时 显示 在 屏幕 上 。 

写 一 个 jasmin 程 序 ， 采 用 Java AWT (或 一 个 类 似 的 图 形 包 ) 在 屏幕 上 显示 牙买加 国旅 。 

写 一 个 jasmin 程 序 ， 确 定 当 前 的 日 期 和 时 间 。 

写 一 个 Time 类 以 支持 时 间 的 算术 操作 。 例 如 ，1:35+2:15 为 3:50， 而 1:45+2:25 为 4:10。 

. 写 一 个 Comp1ex 类 ， 支 持 复数 (如 3+4i) 的 加 法 、 减 法 和 乘法 。 

. 斐 波 那 契 序列 可 如 下 递归 定义 ;序列 的 第 一 个 元 素 和 第 二 个 元 素 的 值 都 是 1。 第 三 个 元 素 是 
第 一 个 元 素 和 第 二 个 元 素 的 和 ， 即 2。 一 般 来 说 ， 第 N 个 斐 波 那 契 数 是 第 N 一 1 个 和 第 N 一 2 个 
斐 波 那 契 数 之 和 。 写 一 个 程序 ， 从 键盘 读 入 一 个 数 N， 并 递归 地 确定 第 N 个 斐 波 那 契 数 。 为 
什么 这 是 解决 这 个 问题 的 一 个 低 效 的 方法 。 

(用 教师 同意 的 任何 一 种 语言 ) 写 一 个 程序 ， 从 磁盘 读 和 一 个 类 文件 ， 并 打印 出 常数 池 中 
的 元 素数 量 。 

(用 教师 同意 的 任何 一 种 语言 ) 写 一 个 程序 ， 从 磁盘 读 入 一 个 类 文件 ， 并 打印 在 其 中 所 定 
义 的 方法 的 名 字 。 
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附录 A 数字 逻辑 


A.1 门 


没有 晶体 管 ， 就 没有 现代 计算 机 。 正 如 摩尔 定律 (晶体管 密度 每 18 个 月 增加 一 倍 ) 所 指 
出 的 ， 制 造 和 安置 晶体 管 的 能 力 是 在 计算 机 芯片 内 控制 ， 移 动 及 处 理 数 据 的 基本 方式 。 

晶体 管 可 被 看 作 是 一 种 电 控 的 开关 。 一 个 典型 的 晶体 管 及 其 电子 图 如 图 A-1 所 示 。 在 正常 
情况 下 ， 电 流 从 发 射 级 流 到 集 电极 ， 就 像 水 流 过 管子 或 汽车 驶 过 隧道 一 样 。 但 是 ， 只 有 在 基 
极 施加 适当 的 电信 号 时 ， 才 允许 电流 流 过 。 没 有 这 个 控制 信号 ， 就 如 同 关闭 了 龙头 或 亮 起 了 
红 灯 。 发 生 这 种 情况 时 ， 电 流 就 不 能 通过 。 通 过 将 这 些 开关 结合 在 一 起 ， 工 程 师 们 就 能 建立 
依赖 结构 ， 例 如 ， 只 有 所 有 晶体 管 都 加 电 时 ， 电 流 才 能 通过 。 


四 四 加 


NPN 唱 体 管 


发 射 级 集 电 级 


生生 品 体 管 的 另 一 种 符号 
日 如 不 


图 A-1 晶体 管 和 符号 的 样 例 


图 A-2 显 示 出 两 个 依赖 结构 的 例子 。 在 串联 (serial) 电路 中 ， 两 个 晶体 管 共 享 一 个 共同 
的 路 径 ， 如 果 电 流 要 从 A 点 流 到 B 点 ， 就 必须 能 同时 流 经 两 个 晶体 管 。 在 并 联 (parallel) 电路 
中 ,每 个 晶体 管 有 其 自身 的 电 尝 路径， 任何 晶体 管 都 能 允许 电流 流 过 电路 。 


图 A-2 串联 (上 图 ) 和 并 联 (下 图 ) 的 晶体 管 
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在 图 A-3 中 显示 的 电路 古 两 个 晶体 管 以 串联 方式 互 连 的 例子 。 为 了 让 电流 从 电源 (Vc) 流 
到 输出 ， 对 两 个 晶体 管 都 要 施加 正确 的 信号 以 保证 电流 通过 。 只 要 两 个 晶体 管 中 任 何 一 个 是 
打开 的 开关 ， 电 流 就 不 能 流 过 。 这 就 意味 着 只 有 帅 体 管 1 是 闭合 的 并 且 (AND) 晶体 管 2 也 是 
闭合 的 情况 下 ， 电 流 才 能 流动 输出 端 有 电力 )。 类 似 地 ， 在 图 A-4 中 ， 两 个 晶体 管 是 并 联 的 ， 
如 果 第 一 个 晶体 管 是 闭合 的 或 者 (OR) 第 二 个 章 体 管 是 闭合 的 (或 者 两 个 晶体 管 都 是 闭合 的 )， 
才能 允许 电流 通过 。 





输出 


或 电路 
图 A-4 简化 的 或 门 和 符号 
计算 机 的 基本 构件 块 由 称 为 门 (gate) 的 简单 电路 组 成 ， 这 些 门 实现 了 这 些 简 单 的 逻辑 信 
号 。 每 个 门 一 般 包 含 1 到 6 个 晶体 管 ， 实 现 了 基本 的 逻辑 和 算术 运算 。 记 住 ， 在 逻辑 中 所 用 的 
基本 值 是 真 和 假 。 如 果 “ 电 流 在 流动 ”代表 真 ， 则 图 A-3 中 电路 就 用 一 个 简单 (并且 有 点 理想 
化 ,不 要 用 Radio Shack (美国 一 家 著名 的 消费 电子 销售 商 ) 的 零件 建造 这 个 系统 ) 的 门 实现 
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了 逻辑 与 (AND) 的 功能 。 其 他 能 实现 的 功能 还 包括 : 或 (OR， 见 图 A-4)、 非 (NOT)、 与 
非 (NAND) 以 及 或 非 (NOR) 。 用 于 绘制 各 种 门 的 符号 在 图 4-5 中 给 出 。 注 意 ， 每 个 门 〈 除 
了 非 门 ) 都 有 两 个 输入 和 一 个 输出 。 还 要 注意 ， 非 门 符号 在 输出 线 上 有 -- 个 圈 (表示 信号 反 
相 )。 与 非 门 ( 即 与 门 的 非 ) .的 符号 和 与 门 的 符号 相同 ,但 在 输出 处 有 一 个 小 圈 表 示 反 相 。 类 
似 地 ， 或 非 门 〈 即 或 门 的 非 ) 就 是 一 个 带 有 反 相 圈 的 或 门 。 


J )- > 


与 门 (AND) 或 门 (OR) 
与 非 门 NAND) 或 非 门 NOR) 
非 门 (NOT) 异 或 门 (XOR) 


图 A-5 门 的 类 型 和 符号 


A.2 组 合 电 路 


复杂 的 门 网 络 可 以 实现 任何 期 望 的 逻辑 反应 。 例 如 ， 异 或 (XOR， 即 eXclusive OR) 的 
功能 是 当 且 仅 当 只 有 一 个 输入 为 真 (而 不 是 两 个 输入 都 为 真 ) 时 ， 输 出 才 为 真 。 用 逻辑 表达 
方式 写 为 : 

AXORB= (AORB) AND (NOT (A AND B)) 

著 写 成 真 值 表 ， 可 如 表 A-1 所 示 。 


表 A-1 定义 了 异 或 功能 的 真 值 表 


A B 结果 
真 真 假 
真 假 真 
假 真 真 
假 假 假 


最 后 ， 要 绘制 成 电路 图 ， 则 如 图 A-6 所 示 。 

组 合 电路 的 基本 概念 就 是 输出 总 是 当前 输入 信号 的 函数 ， 而 无 须 考虑 信号 的 历史 变化 。 
这 样 的 电路 对 于 实现 简单 的 判定 或 算术 操作 非常 有 用 。 对 于 如 何 设计 这 种 电路 的 全 面 性 描述 
超出 了 本 附录 的 范围 ， 图 A-7 显 示 出 和 如何 用 一 组 门 来 实现 简单 的 二 进 制 加 法 (计算 机 的 算术 逻 
辑 单元 (ALU) 的 组 成 部 分 )。 
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A 


AXORB 
图 A-6 用 门 实现 异 或 功能 


A 
B S 


A+B 
图 4-7 单个 位 的 半 加 法 器 

明确 地 说 ， 这 个 电路 要 接受 两 个 位 信号 (A 和 B)， 并 输出 这 两 个 信号 的 和 以 及 是 否 有 进 
位 。( 这 个 电路 有 了 时 被 称 为 “ 半 加 法 器 ”)。 对 二 进 制 加 法 表 进 行 检 查 可 以 发 现 ， 两 个 位 的 和 就 
是 对 它们 做 异 或 运算 ， 而 当 且 仅 当 两 个 位 都 是 1 时 才 产 生 进位 ， 换 旬 话 说 ， 就 是 两 个 位 的 与 。 
类 似 的 分 析 能 得 出 一 个 更 复杂 的 设计 ,这 个 设计 能 加 入 前 一 级 加 法 的 进位 (就 是 “全 加 法 器 ”， 
见 图 A-8)， 或 者 一 次 将 若干 个 位 相 加 (就 像 在 寄存 器 中 )。 图 A-9 显 示 出 如 何 用 4 个 全 加 法 器 电 
路 的 复制 来 执行 一 个 4 位 的 加 法 。 当 然 ，32 位 的 复制 就 能 将 奔腾 的 两 个 寄存 器 相 加 。 我 们 也 可 
以 建立 一 个 电路 来 执行 二 进 制 乘 及 其 他 操作 。 将 这 些 简单 的 门 增殖 几 十 亿 倍 ， 就 达到 了 奔腾 
的 能 力 和 复杂 度 。 


C 


A 
B 





图 A-8 单个 位 的 全 加 法 器 ( 带 进 位 ) 
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图 A-9 级 联 的 4 位 加 法 器 ， 包 括 内 部 进位 


A.3 时 序 电路 


与 组 合 电路 形成 对 照 的 是 ， 时 序 电路 保留 一 些 存储 单元 和 电路 的 历史 信息 。 时 序 电路 的 
输出 不 仅 取决 于 当前 输入 ， 也 取决 于 过 去 的 输入 。 对 此 的 另 一 种 表达 方式 就 是 这 种 电路 有 一 - 
个 内 部 状态 。 通 过 利用 这 个 内 部 状态 ， 我 们 就 可 以 存储 信息 以 备 后 用 ， 实 质 上 就 是 为 寄存 器 
创建 必要 的 存储 空间 。 

一 种 最 简单 的 时 序 电 路 就 是 S-R 触 发 器 (S-R flip-flop)， 如 图 A-10 所 示 。 为 理解 这 个 电路 ， 

首先 假设 S 和 R 都 是 0〈 假 )，C 是 0，C 为 1 ( 真 )。 由 于 2 为 真 ，R NOR Q 就 是 1。 类 似 地 ，S 
NOR @C 就 是 1。 这 样 ， 我 们 看 到 这 个 配置 在 内 部 是 一 致 的 ， 只 要 每 个 部 件 都 在 工作 (通常 就 是 
指 带 电 ) ， 电 路 就 保持 稳定 。 类 似 的 分 析 还 可 看 出 ， 如 果 S$ 和 R 都 是 0， 而 2 是 1 时 ， 结 果 就 是 一 
个 自身 一 致 的 稳定 状态 。 
”这 个 简单 的 触发 器 可 用 作为 1 位 存储 器 ，8 的 值 就 是 存储 在 寄存 器 中 的 值 。 信 号 S 和 R 可 分 
别 用 于 对 触发 器 置 位 和 复位 ( 置 为 1 或 0) 。 我 们 可 以 观察 到 ， 如 果 $ 变 为 1， 将 迫使 上 面 的 NOR 
门 的 输出 成 为 0。 在 R 和 2 都 为 0 的 情况 下 ， 下 面 NOR 门 的 输出 就 为 1， 所 以 现在 存储 的 值 就 是 
1。 类 似 地 分 析 ， 如 果 R 置 为 1!1， 就 迫使 QO 成 为 1，Q 成 为 0。 
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| 


图 A-10 S-R 触 发 器 ， 带 存储 器 的 电路 


遗憾 的 是 ， 如 果 S 和 R 都 是 1， 就 会 发 生 不 好 的 事情 。 根 据 符 号 表示 ，Q 和 C 应 该 总 是 取 相 
反 的 值 。 但 如 果 两 个 输入 都 是 1， 则 两 个 输出 就 都 是 0 (你 可 以 自行 确认 一 下 )。 从 纯粹 的 数学 
意义 上 说 ， 我 们 可 以 将 这 看 作 是 在 逻辑 上 与 用 零 除 等 价 的 情况 ， 即 是 一 种 要 避免 而 不 是 要 分 
析 的 东西 。 类 似 地 ， 即 使 在 输入 线 上 的 一 个 短暂 电 尖 峰 也 会 导致 触发 器 不 可 预测 地 改变 状态 ， 
这 是 要 尽 可 能 避免 的 事情 。 

由 于 要 避免 这 种 事情 ， 其 他 种 类 的 时 序 电 路 就 更 常用 于 计算 机 。 最 常见 的 电路 将 控制 信 
号 与 时 序 信号 (通常 称 为 时 钟 信号 ) 结合 起 来 ， 用 以 同步 控制 信号 并 防止 短期 波动 对 电路 的 
存储 元 件 产生 影响 。 请 注意 看 图 A-11 ， 时 钟 信号 的 作用 是 使 触发 器 能 改变 状态 。 如 果 时 钟 信 
号 为 低 ， 则 $ 或 R 的 变化 不 能 影响 电路 存储 元 件 的 状态 。 


S 


时 钟 


图 A-11 一 个 时 钟 同步 的 S-R 触 发 器 


我 们 可 以 将 这 个 时 钟 同步 的 触发 器 进一步 扩展 ， 使 其 更 有 用 和 更 安全 。 图 A-12 的 电路 图 
显示 的 是 一 个 D 触 发 器 。 如 你 所 见 ， 这 个 电路 在 时 钟 以 外 只 有 一 个 输入 。D 输 入 捆绑 到 触发 器 
的 S 输 入 ,而 D 的 互补 端 D 则 被 捆 乡 到 FR 输入。 这 就 避免 了 S 和 RR 同时 为 1。 当 一 个 时 钟 脉冲 发 
生 时 ，D 的 值 就 被 存储 到 触发 器 (如果 D 的 值 是 1， 则 Q 变 成 1， 如 果 D 的 值 为 0， 则 Q 变 成 0)。 
时 钟 脉冲 发 生 之 前 ， 在 D 端 的 变化 不 会 影响 触发 器 的 值 。 这 就 使 D 触 发 器 在 复制 和 存储 数据 方 
面 非 党 有用。 比如， 可 从 LO 设备 中 读 入 数据 到 寄存 器 以 备 后 用 。 


D 


ol 


时 钟 


图 A-12 一 个 D 触 发 器 
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SR 触发 器 的 另 一 个 变型 就 是 T 触 发 器 (图 A-13)。 像 D 触 发 器 一 样 ， 这 是 将 时 钟 同步 的 S-R 
触发 器 扩展 成 单 输入 ， 但 附加 了 反馈 线 ， 用 于 控制 输入 /时 钟 脉冲 如 何 通过 。 在 这 个 电路 中 ， 
每 次 输入 被 触发 ， 触 发 器 就 改变 状态 (翻转)。 例 如 ， 如 果 Q 是 1 (那么 2 就 是 0) ， 则 下 一 个 
脉冲 就 会 触发 下 面 的 输入 线 (本 质 上 就 是 前 面 电路 的 R 输 入 )， 并 复位 触发 器 使 得 Q 为 0。 


时 钟 


图 A-13 一 个 T 触 发 器 


A.4 计算 机 操作 


采用 这 些 构件 块 就 可 以 建立 与 计算 机 体系 结构 相关 的 高 级 结构 。 特 别 是 ， 一 组 1 位 的 触发 
器 (如 S-R 触 发 器 ) 就 能 实现 一 个 简单 的 寄存 器 并 存储 所 需 数据 。 例 如 ， 要 做 加 法 ， 需 要 两 个 
1 位 寄存 器 ， 每 个 寄存 器 的 Q 输 出 都 连接 到 简单 加 法 电路 的 一 个 输入 。 结 果 输 出 位 就 是 这 两 个 
寄存 器 位 的 和 ， 可 捕获 并 (通过 一 个 DD 触发 器 ) 存储 在 另 一 个 寄存 器 中 。T 触 发 器 可 与 加 法 器 
电路 结合 使 用 ， 以 建立 一 个 简单 的 脉冲 计数 器 。 当 然 ， 这 些 描述 过 于 简略 ， 但 能 够 让 你 对 计 
算 机 设计 者 所 面临 的 任务 有 所 认识 。 
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本 文中 的 示例 助 记 符 (操作 码 用 十 六 进 制 表示 ) 一 一 说 明 
概要 : 本 操作 码 并 不 存在 ， 只 是 用 来 说 明 每 个 条 目的 格式 。 右 侧 描述 的 是 相应 操作 所 需 
的 必要 初始 堆栈 状态 和 创建 的 最 终 堆 栈 状 态 。 注 意 ，long 和 double 需要 占用 两 个 堆栈 单元 ， 
如 下 所 示 。 
初始 状态 : long 
long 
最 终 状 态 : float 
aaload(0x32) 一 一 从 地 址 数组 中 加 载 值 
概要 从 堆栈 中 弹出 一 个 数组 地 址 (对象 引 用 ) 和 integer， 取 出 一 维 地 址 数组 中 指定 位 
置 的 值 。 取 出 的 值 被 压 人 栈 顶 。 
初始 状态 : int (索引 ) 
address( 数 组 引用 ) 
最 终 状态 : address (对 象 ) 
aastore(0x53) 存储 值 到 地 址 数组 中 
概要 ， 将 地 址 (数组 引用 ) 存储 到 同类 型 的 地 址 数组 中 。 顶 端 所 弹出 的 参数 为 定义 所 用 
位 置 的 索引 。 第 二 个 弹出 的 参数 为 需 存储 的 地 址 值 ， 第 三 个 (最 后 一 个 ) 参数 为 数组 本 身 。 
初始 状态 : int (索引 ) 
address( 对 象 ) 
address (数组 引用 ) 
最 终 状 态 : 一 
aconst_nuyll(0x1) 一 一 压 入 数组 常量 null 
概要 : 将 机 器 定义 的 常量 null 作 为 地 焉 压 人 操作 数 栈 中 。 
初始 状态 : 一 
最 终 状 态 : address (null) 
aload<varnum>(0x19)[byte/short] 一 一 从 局 部 变量 中 加 载 地 址 
概要 : 从 第 <varnum> 个 局 部 变量 中 加 载 地 址 (对 象 引 用 ) 并 压 和 人 堆栈。 在 不 使 用 宽 
(wide) 操 作 数 前 缀 的 情况 下 ，<varnum> 的 值 是 一 个 0...255 范 围 的 byte。 否 则 为 0...6$536 范 围 的 
short。 注 意 : 子 过 程 的 返回 地 址 不 能 够 通过 a10ad 或 其 他 操作 码 从 存储 位 置 中 加 载 。 
初始 状态 ; 一 
最 终 状 态 ; address 
aload_0(0x2a) 一 一 从 局 部 变量 0 加 载 地 址 
概要 : 从 局 部 变量 0 中 加 载 地 址 〈 对 象 引 用 ) 并 压 入 堆栈 中 。 此 功能 等 价 于 aload 0, 但 
它 占用 的 字 节 数 更 少 且 速度 更 快 。 
初始 状态 ; 一 
最 终 状 态 ; address 
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aload_1(0x2b) 一 一 从 局 部 变量 1 加 载 地 址 
概要 : 从 局 部 变量 1 中 加 载 地 址 〈 对 象 引 用 ) 并 压 人 堆栈 中 。 此 功能 等 价 于 aload 1， 但 


它 占用 的 字 节 数 更 少 且 速度 更 快 。 


初始 状态 : 一 

最 终 状 态 :， address 

aload_2(0x2c) 一 一 从 局 部 变量 2 加 载 地 址 

概要 ， 从 局 部 变量 2 中 加 载 地 址 (对象 引用 ) 并 压 入 堆栈 中 。 此 功能 等 价 于 aload 2， 但 





它 占 用 的 字 节 数 更 少 且 速 度 更 快 。 


初始 状态 : 一 

最 终 状态 ，address 

aload_3(0x2d) 从 局 部 变量 3 加 载 地 址 

概要 : 从 局 部 变量 3 中 加 载 地 址 (对象 引用 ) 并 压 人 堆栈 中 。 此 功能 等 价 于 aload 3， 但 





它 占用 的 字 节 数 更 少 且 速度 更 快 。 


初始 状态 ; 一 

最 终 状 态 ，address 

anewarray<type>(0xbd)[int] 一 一 创建 一 维 对 象 数组 

概要 : 为 类 型 为 <type> 的 一 维 数组 分 配 空间 并 将 新 数组 的 引用 压 人 堆栈 。 字 节 码 中 的 type 


为 常数 地 中 的 4 字 节 索引 。 新 数组 的 大 小 由 从 栈 顶 弹出 的 一 个 integer 来 表示 。 


初始 状态 : int (大 小 ) 

最 终 状 态 : address (数组 ) 

anewarray_quick(0xde) 一 一 anewarray 字 节 码 的 快速 版 本 

概要 ;Sun 公司 的 JIT 编 译 器 中 内 部 使 用 的 anewarray 操 作 码 的 优化 版 本 。 这 一 操作 码 不 


会 出 现在 目前 未 加 载 和 执行 的 .c1ass 文 件 中 。 


和 初始 状态 : 参见 anewarray 操 作 码 

最 终 状 态 : 参见 anewarray 操 作 码 

areturn(0xb0) 从 方法 中 返回 地 址 结果 

概要 :; 从 当前 方法 栈 中 弹出 地 址 (对 象 引用 ) ， 并 将 这 一 对 象 压 人 到 调用 者 环境 中 的 方法 





。 当 前 方法 被 终止 ， 控 制 转移 到 调用 者 环境 。 


初始 状态 ; address 

最 终 状 态 : (n/a) 

arraylength(0xbe) 一 一 获得 数组 长 度 

概要 ， 从 堆栈 中 弹出 数组 地址) 并 将 此 数组 的 长 度 (integer) 压 人 堆栈 。 对 于 多 维 数 
返回 的 是 第 一 维 的 长 度 。 

初始 状态 : address (数组 ) 引用 

最 终 状态 : int 

astore<varnum>(0x3a)[byte/short] 一 一 存储 地 址 到 局 部 变量 中 

概要 : 从 堆栈 中 弹出 一 个 地 址 (对象 引 用 或 子 过 程 的 返回 位 置 ) 并 将 其 存储 到 第 


<varnum> 个 局 部 变量 中 。 在 不 使 用 宽 (wide) 操 作 数 前 绥 的 情况 下 ，<varnaaum> 的 值 是 一 个 
0...255 范 围 的 byte。 否 则 为 0...65536 范 围 的 short。 


初始 状态 ; address 
最 终 状 态 : 一 
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astore_0(0x4b) 一 一 存储 地 址 到 局 部 变量 0 中 
概要 : 从 栈 顶 弹出 一 个 地 址 (对 象 引用 ) 并 存储 到 局 部 变量 0 中 。 此 功能 等 价 于 astore 0， 
但 它 占 用 的 字 节 数 更 少 且 速 度 更 快 。 
初始 状态 ， address 
最 终 状 态 : 一 
astore_1(0x4c) 一 一 存储 地 址 到 局 部 变量 1 中 
概要 : 从 栈 顶 弹出 一 个 地 址 (对象 引 用 ) 并 存储 到 局 部 变量 1 中 。 此 功能 等 价 于 astore 1， 
但 它 占 用 的 字 节 数 更 少 且 速 度 更 快 。 
初始 状态 : address 
最 终 状 态 ; 一 
astore_2(0x4d) 一 一 存储 地 址 到 局 部 变量 2 中 
概要 : 从 栈 顶 弹出 一 个 地 址 (对 象 引 用 ) 并 存储 到 局 部 变量 2 中 。 此 功能 等 价 于 astore 2， 
但 它 占 用 的 字 节 数 更 少 且 速 度 更 快 。 
初始 状态 : address 
最 终 状 态 : 一 
astore_3(0x2e) 存储 地 址 到 局 部 变量 3 中 
概要 : 从 栈 顶 弹出 一 个 地 址 (对象 引用 ) 并 存储 到 局 部 变量 3 中 。 此 功能 等 价 于 astore 3， 
但 它 占 用 的 字 节 数 更 少 且 速 度 更 快 。 
初始 状态 address 
最 终 状 态 : 一 
athrow(0xbf 一 一 抛 出 异常 /错误 
概要 : 从 栈 顶 弹出 一 个 地 址 (对象 引 用 ) 并 将 此 对 象 作为 异常 “ 抛 给 ”预定 义 的 句柄 。 
此 对 象 类 型 必须 为 throwable。 如 果 没 有 预定 义 的 句柄 ， 当 前 方法 会 终止 ， 并 在 调用 者 环境 中 
重新 抛 出 此 异常 。 这 一 过 程 会 重复 执行 ， 直 至 找到 句柄 或 没有 调用 者 环境 。 若 无 调用 者 环境 ， 
进程 /线程 将 会 终止 。 若 找到 句柄， 对 象 会 压 人 到 句柄 的 堆栈 并 将 控制 转移 给 句柄 。 
初 娩 状态 ; address (throwable ) 
最 终 状 态 : (n/a) 
baload(0x33) 一 一 从 byte 数 组 中 加 载 值 
概要 : 从 堆栈 中 弹出 一 个 数组 和 integer， 取 出 一 维 byte 数 组 中 指定 位 置 的 值 。 取 出 的 值 转 
换 为 一 个 integer 并 压 入 栈 顶 。 
初始 状态 int (索引 ) 
address( 数 组 引用 ) 
最 终 状 态 ; int 
bastore(0x54) 一 一 存储 值 到 byte 数 组 中 
概要 : 将 8 位 的 字 节 存储 到 byte 数 组 中 。 顶 端 所 弹出 的 参数 为 定义 所 用 位 置 的 索引 。 第 二 
个 弹出 的 参数 为 需 存 储 的 byte 值 ， 第 三 个 (最 后 一 个 ) 参数 为 数组 本 身 。 第 二 个 参数 从 int 截 
断 为 byte 并 存储 在 数组 中 。 
使 用 类 似 的 语义 ，baload 也 用 于 从 boolean 数 组 中 加 载 值 。 
初始 状态 int (索引 ) 
int(byte 或 boolean) 
address (数组 引用 ) 
最 终 状 态 : 一 
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Bipush<constant>(0x10[byte]) 一 一 压 入 integer|byte 
概要 : 作为 参数 的 byte 值 (一 128...127) 符号 扩展 成 一 个 integer 后 压 人 栈 中 。 
初始 状态 ; 一 
最 终 状态 : int 
breakpoint(0xca) 一 一 断 点 (保留 的 操作 码 ) 
概要 : 这 一 操作 码 保留 为 JVM 实 现 内 部 使 用 ， 通 常用 于 支持 调试 功能 。 在 类 文件 中 出 现 
此 操作 码 将 是 非法 的 ， 这 样 的 类 文件 也 不 能 通过 校 验 。 
初始 状态 : (n/a) 
最 终 状 态 : (n/a) 
caload(0x34) 一 一 从 char 数 组 中 加 载 值 
概要 : 从 堆栈 中 弹出 一 个 数组 和 integer， 取 出 一 维 char 数 组 中 指定 位 置 的 值 。 取 出 的 值 转 
换 为 一 个 integer 并 压 人 栈 顶 。 
初始 状态 : int (索引 ) 
address( 数 组 引用 ) 
最 终 状 态 : int 
castore(0x54) 一 一 存储 值 到 char 数 组 中 
概要 : 将 16 位 的 UTF 一 16 字 符 存 储 到 char 数 组 中 。 顶 端 所 弹出 的 参数 为 定义 数组 位 置 的 索 
引 。 第 二 个 弹出 的 参数 为 需 存储 的 char 值 ， 第 三 个 〈 最 后 一 个 ) 参数 为 数组 本 身 。 第 二 个 参 
数 从 int 截 断 为 char 并 存储 到 数组 中 。 
初始 状态 : int (索引 ) 
int(char) 
address (数组 引用 ) 
最 终 状 态 : 一 
checkcast<type>(0xc0[ 常 数 池 索 引 ]) 一 一 确认 类 型 是 否 兼 容 
概要 : 检查 (但 不 弹出 ) 栈 顶 元 素 以 确认 它 是 否 为 一 个 可 转换 为 参数 指定 类 型 的 地 址 
(对 象 或 数组 引用 ) 。 换 言 之 ， 对 象 或 者 为 nul1， 或 者 为 <type> 或 <type> 父 类 的 一 个 实例 (参见 
instanceof )。 字 节 码 中 的 type 为 常数 池 的 2 字 节 索引 。 如 果 类 型 不 兼容 ， 会 抛 出 Class Cast 
Exception 异 常 (参见 athrow) 。 
初始 状态 ，address 
最 终 状 态 : address 
checkcast quick(0xe0) 一 一 checkcast 字 节 码 的 快速 版 本 
概要 : Sun 公 司 的 JIT 编 译 器 中 内 部 使 用 的 checkcast 操 作 码 的 优化 版 本 。 这 一 操作 码 不 会 
出 现在 目前 未 加 载 和 执行 的 .class 文 件 中 。 
初始 状态 : 参见 checkcast 操 作 码 
最 终 状 态 : 参见 checkcast 操 作 码 
d2f(0x90) 一 一 将 double 转 换 为 float 
概要 :从 栈 中 弹出 双 字 的 double， 将 其 转换 为 单字 的 float 并 压 入 栈 中 。 
初始 状态 ; double 
double 
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d2i(0x8e) 一 一 将 double 转 换 为 integer 
概要 : 从 栈 中 弹出 双 字 的 double， 将 其 转换 为 单字 的 integer 并 压 人 栈 中 。 
初始 状态 : double 
double 
最 终 状态 : int 
d21(0x8f) 将 double 转 换 为 long 
概要 : 从 栈 中 弹出 双 字 的 double， 将 其 转换 为 双 字 的 long 并 压 人 栈 中 。 
初始 状态 ，double 
double 
最 终 状 态 : long 
long 
dadd(0x63) double 加 法 
概要 ， 从 栈 中 弹出 两 个 double， 计 算 其 和 并 压 人 栈 中 。 
初始 状态 : double 一 1 
double 一 1 
double 一 2 
double 一 2 
最 终 状 态 ; double 
double 
daload(Ox31) 从 double 数 组 中 加 载 值 
概要 ， 从 堆栈 中 弹出 一 个 数组 和 integer， 取 出 一 维 double 数 组 中 指定 位 置 的 值 并 压 人 栈 顶 。 
初始 状态 ，int 〈 索 引 ) 
address( 数 组 引用 ) 
最 终 状 态 : double 
double 
dastore(Ox52) 存储 值 到 double 数 组 中 
概要 : 将 双 字 的 double 存 储 到 double 数 组 中 。 顶 端 所 弹出 的 参数 为 定义 所 用 位 置 的 索引 。 
第 二 个 /三 个 弹出 的 参数 为 需 存储 的 double 值 ， 最 后 一 个 参数 为 数组 本 身 。 
初始 状态 ; int (索引 ) 
double 
double 
address (数组 引用 ) 
最 终 状 态 ; 一 
dcmpg(0x98) 一 一 比较 double， 在 存在 NaN 的 情况 下 返回 1 
概要 ， 将 两 个 双 字 的 double 从 操作 数 栈 中 弹出 ， 将 比较 结果 -1，0 或 1 (作为 一 个 integer) 
压 人 栈 中 。 如 果 double 一 2 大 于 double 一 1， 将 +1 压 入 栈 中 ， 如 果 二 者 相等 ， 将 0 压 入 栈 中 ， 否 则 
的 话 将 一 1 压 入 栈 中 。 如果 弹出 的 任意 一 个 字 或 两 个 字 解 释 为 double 时 等 于 IEEE NaN ( 非 数 字 )， 
则 将 结果 +1 压 入 栈 中 。 
初始 状态 ;double 一 1 
double 一 1 
double—2 
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double 一 2 
最 终 状 态 : int 
dcmplOx97) 比较 double ， 在 存在 NaN 的 情况 下 返回 一 1 





概要 : 将 两 个 双 字 的 double 从 操作 数 栈 中 弹出 ， 将 比较 结果 -1，0 或 1 (作为 一 个 integer) 
压 人 栈 中 。 如 果 double-2 大 于 double--1， 将 +1 压 人 栈 中 ， 如 果 二 者 相等 ， 将 0 压 入 栈 中 ， 否 则 
的 话 将 -1 压 人 栈 中 。 如 果 弹 出 的 任意 一 个 字 或 两 个 字 解 释 为 double 时 等 于 IEEE NaN ( 非 数 字 )， 
则 将 结果 一 1 压 入 栈 中 。 
初始 状态 ; double 一 1 
double 一 1 
double 一 2 
double 一 2 
最 终 状 态 : int 
dconst_0(0xe) 一 一 压 入 double 常 量 0.0 
概要 : 将 64 位 IEEE 双 精度 浮 点 数 常量 0.0 压 和 人 操作 数 栈 中 。 
初始 状态 ;一 
最 终 状 态 ，double(0.0) 
double(0.0) 
dconst_1(0xf) 压 入 double 常 量 1.0 
概要 : 将 64 位 IEEE 双 精度 浮 点 数 常量 1.0 压 人 操作 数 栈 中 。 
初始 状态 ; 一 
最 终 状 态 : double(1.0) 
double(1.0) 
ddiv(Ox6f) double 除 法 
概要 : 弹出 两 个 双 字 的 双 精 度 浮 点 数 ， 并 将 double 一 1 除 double 一 2 的 结果 压 和 人 栈 中 。 
初始 状态 ; double 一 1 
double—1 
double 一 2 
double—2 
最 终 状 态 : double 
double 
dload<varnum>(0x18[byte/short]) 一 一 从 局 部 变量 中 加 载 double 
概要 ;从 第 <varnum> 和 <varnum>+1 个 局 部 变量 中 加 载 双 字 的 双 精 度 浮 点 数 并 压 入 堆栈 。 
在 不 使 用 宽 (wide) 操 作 数 前 级 的 情况 下 ，<varnum> 的 值 是 一 个 0...255 范 围 的 byte。 否 则 为 
0...65536 范 围 的 short。 
初始 状态 ， 一 
最 终 状 态 : double 
double 
dload_0(0x26) 一 一 从 局 部 变量 0/1 加 载 double 
概要 : 从 局 部 变量 0 和 1 中 加 载 双 精度 浮 点 数 并 压 人 堆栈 中 。 此 功能 等 价 于 dl1oad 0, 但 它 
占用 的 字 节 数 更 少 且 速度 更 快 。 
初始 状态 : 一 
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最 终 状态 : double 
double 
dload_1(0x27) 一 一 从 局 部 变量 1/2 加 载 double 
概要 : 从 局 部 变量 1 和 2 中 加 载 双 精 度 浮 点 数 并 压 人 堆栈 中 。 此 功能 等 价 于 dl1oad 1， 但 它 
占用 的 字 节 数 更 少 是 速度 更 快 。 
初始 状态 : 一 
最 终 状 态 ; double 
double 
dload_2(0x28) 从 局 部 变量 2/3 加 载 double 
概要 ， 从 局 部 变量 2 和 3 中 加 载 双 精 度 浮 点 数 并 压 入 堆栈 中 。 此 功能 等 价 于 dioad 2， 但 它 
占用 的 字 节 数 更 少 且 速 度 更 快 。 
初始 状态 : 一 
最 终 状 态 : double 
double 
dload_3(0x29) 一 一 从 局 部 变量 3/4 加 载 double 
概要 ， 从 局 部 变量 3 和 4 中 加 载 双 精 度 浮 点 数 并 压 人 堆栈 中 。 此 功能 等 价 于 dload 3, 但 它 
占用 的 字 节 数 更 少 且 速 度 更 快 。 
初始 状态 ; 一 
最 终 状 态 : double 
double 
dmul(Ox6b) double 乘 法 
概要 ， 弹出 两 个 双 字 的 双 精 度 浮 点 数 ， 并 将 二 者 的 乘积 压 人 栈 中 。 
初始 状态 ; double 一 ! 
double 一 1 
double 一 2 
double 一 2 
最 终 状 态 ; double 
double 
dneg(0Ox77) double 求 反 
概要 ， 弹出 一 个 双 字 的 双 精 度 浮 点 数 ， 符 号 求 反 ( 乘 以 -1) 后 压 入 栈 中 。 
初始 状态 : double 
double 
最 终 状 态 : double 
double 
drem(Ox73) double 求 余 
概要 ， 弹出 两 个 双 字 的 双 精度 浮 点 数 ， 并 将 double 一 1 除 double 一 2 的 余数 压 入 栈 中 。 
初始 状态 ; double 一 1 
double—1 
double 一 2 
double 一 2 
最 终 状 态 : double 
double 
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dreturn(0xb0) 一 一 从 方法 中 返回 double 
概要 : 从 当前 方法 栈 中 弹出 双 字 的 双 精 度 浮 点 数 并 压 入 到 调用 者 环境 中 的 方法 栈 。 当 前 
方法 被 终止 ， 控 制 转移 到 调用 者 环境 。 
初始 状态 ; double 
double 
最 终 状 态 ; (n/a) 
dstore<varnum>(0x39)[byte/shott] 一 一 存储 double 到 局 部 变量 中 
概要 ， 从 堆栈 中 弹出 一 个 double 并 将 其 存储 到 第 <varnum> 和 <varnum>+1 个 局 部 变量 中 。 
在 不 使 用 宽 (wide) 操 作 数 前 级 的 情况 下 ，<varnum> 的 值 是 一 个 0...255 范 围 的 byte。 否 则 为 
0...65536 范 围 的 short。 
初始 状态 ;: double 
double 
最 终 状 态 ; 一 
dstore_0(0x47) 一 一 存储 double 到 局 部 变量 0/1 中 
概要 : 从 栈 顶 弹出 一 个 double 并 存储 到 局 部 变量 0 和 1 中 。 此 功能 等 价 于 dstore 0, 但 它 
占用 的 字 节 数 更 少 且 速度 更 快 。 
初始 状态 ; double 
double 
最 终 状 态 : 一 
dstore_1(0x48) 一 一 存储 地 址 到 局 部 变量 1/2 中 
概要 :， 从 栈 顶 弹出 一 个 double 并 存储 到 局 部 变量 1 和 2 中 。 此 功能 等 价 于 dstore 1, 但 它 
占用 的 字 节 数 更 少 且 速度 更 快 。 
初始 状态 : double 
double 
最 终 状态 : 一 
dstore_2(0x49) 一 一 存储 double 到 局 部 变量 2/3 中 
概要 : 从 栈 顶 弹出 一 个 double 并 存储 到 局 部 变量 2 和 3 中 。 此 功能 等 价 于 dstore 2, 但 它 
占用 的 字 节 数 更 少 且 速度 更 快 。 
初始 状态 : double 
double 
最 终 状态 : 一 
dstore_3(0x4a) 一 一 存储 double 到 局 部 变量 3/4 中 
概要 : 从 栈 顶 弹出 一 个 double 并 存储 到 局 部 变量 3 和 4 中 。 此 功能 等 价 于 astore 3， 但 它 
占用 的 字 节 数 更 少 且 速度 更 快 。 
初始 状态 : double 
double 
最 终 状态 : 一 
dsub(0x67) 一 一 double 减 法 
概要 : 弹出 两 个 双 字 的 双 精 度 浮 点 数 ， 并 将 double 一 2 减 double 一 1 的 结果 压 入 栈 中 。 
初始 状态 : double 一 1 
double 一 1 
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double 一 2 
double 一 2 
最 终 状 态 ，double 
double 
dup(0x59) 一 一 复制 栈 顶 的 字 
概要 : 复制 栈 顶 的 一 个 字 并 压 入 栈 中 。 
初始 状态 : word 一 1 
最 终 状 态 : word 一 1 
word—1 
dup2(0x5c) 一 一 复制 栈 顶 的 两 个 字 
概要 : 复制 栈 顶 的 两 个 字 并 压 人 栈 中 。 被 复制 的 项 可 以 是 两 个 独立 的 单字 项 〈 如 int、 
float 或 地 址 ) 或 一 个 双 字 项 (如 long 或 double)。 
初始 状态 : word 一 1 
word—2 
最 终 状 态 : word 一 1 
word—2 








word—1 

word—2 
dup2_x1(0x5d) 一 一 复制 栈 项 的 两 个 字 并 插入 到 第 三 个 字 的 下 面 
概要 : 复制 栈 顶 的 两 个 字 并 插入 到 第 三 个 字 的 下 面 ， 作 为 第 四 和 第 五 个 字 。 被 复制 的 项 

可 以 是 两 个 独立 的 单字 项 (如 int、float 或 地 址 ) 或 一 个 双 字 项 〈 如 long 或 double ) 。 

初始 状态 : word 一 1 

word—2 

word 一 3 
最 终 状 态 ，word 一 1 

word 一 2 

word 一 3 

word—1 

word—2 
dup2_x2(0x5e) 一 一 复制 栈 顶 的 两 个 字 并 搬入 到 第 四 个 字 的 下 面 
概要 : 复制 栈 顶 的 两 个 字 并 插入 到 第 四 个 字 的 下 面 ， 作 为 第 五 和 第 六 个 字 。 被 复制 的 项 

可 以 是 两 个 独立 的 单字 项 (如 int、float 或 地 址 ) 或 一 个 双 字 项 (如 long 或 double)。 

初始 状态 : word 一 1 

word—2 

word 一 3 

word—4 
最 终 状 态 : word 一 I 

word 一 2 

word 一 3 

word—4 

word—1 

word 一 2 
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dup_x2(0x5a) 一 一 复制 栈 项 的 一 个 字 并 插入 到 第 二 个 字 的 下 面 
概要 : 复制 栈 顶 的 一 个 字 并 插入 到 第 二 个 字 的 下 面 ， 作 为 第 三 个 字 。 
初始 状态 : word 一 1 

word—2 
最 终 状态 word 一 1 

word—2 

word—1 
dup_x2(0x5b) 一 一 复制 栈 项 的 一 个 字 并 插入 到 第 三 个 字 的 下 面 
概要 : 复制 栈 顶 的 一 个 字 并 插入 到 第 三 个 字 的 下 面 ， 作 为 第 四 个 字 。 
初始 状态 : word 一 1 

word—2 
最 终 状 态 ; word 一 1 

word—2 





word—1 
f2d(0x8d) 将 float 转 换 为 double 
概要 : 从 栈 中 弹出 单字 的 float 浮 点 数 ， 将 其 转换 为 双 字 的 double 并 压 入 栈 中 。 
初始 状态 : float 
最 终 状 态 : double 
double 
f2i(0x8b) 将 float 转 换 为 int 
概要 : 从 栈 中 弹出 单字 的 float 浮 点 数 ， 将 其 转换 为 单字 的 integer 并 压 和 人 栈 中 。 
初始 状态 : float 
最 终 状 态 ，int 
f2I(0x8c) 一 一 将 float 转 换 为 Iong 
概要 ， 从 栈 中 弹出 单字 的 float 浮 点 数 ， 将 其 转换 为 双 字 的 long 并 压 入 栈 中 。 
初始 状态 float 
最 终 状态 : long 
long 








fadd(0x62) float 加 法 
概要 :， 从 栈 中 弹出 两 个 float， 计 算 其 和 并 压 和 人 栈 中 。 
初始 状态 : float 
float 
最 终 状 态 : float 
faload(Ox30) 从 float 数 组 中 加 载 值 
概要 : 从 堆栈 中 弹出 一 个 数组 和 integer， 取 出 一 维 fioat 数 组 中 指定 位 置 的 值 并 压 和 人 栈 顶 。 
初始 状态 int (索引 ) 
address( 数 组 引用 ) 
最 终 状 态 : float 
fastore(Ox51) 存储 值 到 float 数 组 中 
概要 : 将 单字 的 float 存 储 到 float 数 组 中 。 顶 端 所 弹出 的 参数 为 定义 所 用 位 置 的 索引 。 第 二 
个 弹出 的 参数 为 需 存储 的 float 值 ， 第 三 个 (最 后 一 个 ) 参数 为 数组 本 身 。 











-mnWt4 和 1 


初始 状态 : int (索引 ) 
float 
address (数组 引用 ) 
最 终 状态 : 一 
fcmpg(0x96) 一 一 比较 float， 在 存在 NaN 的 情况 下 返回 1 
概要 : 将 两 个 单字 的 float 从 操作 数 栈 中 弹出 ， 将 比较 结果 -1，0 或 1 (作为 一 个 integer) 
压 入 栈 中 。 如 果 float 一 2 大 于 float--1， 将 +1 压 人 栈 中 ， 如 果 二 者 相等 ， 将 0 压 入 栈 中 ， 否 则 的 
话 将 -1 压 人 栈 中 。 如 果 弹 出 的 任意 一 个 字 或 两 个 字 解 释 为 浮 点 数 时 等 于 IEEE NaN ( 非 数字 ) ， 
则 将 +1 压 入 栈 中 。 
初始 状态 : float 一 1 
float—2 
最 终 状 态 : int 
fcmpl(0x95) 一 一 比较 float， 在 存在 NaN 的 情况 下 返回 -1 
概要 : 将 两 个 单字 的 float 从 操作 数 栈 中 弹出 ， 将 比较 结果 一 1， 0 或 1 (作为 一 个 integer) 
压 人 栈 中 。 如 果 float--2 大 于 float-1， 将 +1 压 人 酚 中 ， 如 果 二 者 相等 ， 将 0 压 入 栈 中 ， 否 则 的 
话 将 ~1 压 入 栈 中 。 如 果 弹 出 的 两 个 字 或 其 中 的 任意 一 个 解释 为 浮 点 数 时 等 于 IEEE NaN ( 非 数 
字 )， 则 将 -1 压 人 栈 中 。 
初始 状态 ; float 一 1 
float—2 
最 终 状 态 : int 
fconst_0(0xb) 一 一 压 入 float 常 量 0.0 
概要 ， 将 32 位 IEEE 的 浮 点 数 常量 0.0 压 入 操作 数 栈 中 。 
初始 状态 ; 一 
最 终 状 态 : float(0.0) 
fconst_1(0xc) 压 入 float 常 量 1.0 
概要 ， 将 32 位 IEEE 的 浮 点 数 常量 1.0 压 入 操作 数 栈 中 。 
初始 状态 : 一 
最 终 状 态 ; float(1.0) 
fconst_2(0xd) 压 入 float 常 量 2.0 
概要 : 将 32 位 IEEE 的 浮 点 数 常量 2.0 压 入 操作 数 栈 中 。 
初始 状态 : 一 
最 终 状 态 ; float(2.0) 
fdiv(Ox6e) float 除 法 
概要 : 弹出 两 个 单字 的 浮 点 数 ， 并 将 float 一 1 除 float 一 2 的 结果 压 人 栈 中 。 
初始 状态 float 一 1 
float—1 
float—2 
float—2 
最 终 状 态 : float 
float 
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fload<varnum>(0x17[byte/shottj) 一 一 从 局 部 变量 中 加 载 float 
概要 ， 从 第 <varnum> 个 局 部 变量 中 加 载 单字 的 float 浮 点 数 并 压 入 堆栈 。 在 不 使 用 宽 
(wide) 操 作 数 前 级 的 情况 下 ，<varnum> 的 值 是 一 个 0...255 范 围 的 byte。 否则 为 0...65536 范 围 的 


Short 。 
初始 状态 ， 一 
最 终 状 态 float 
fmul(Ox6a) 





float 箭 法 


概要 : 弹出 两 个 单字 的 float 浮 点 数 ， 并 将 二 者 的 乘积 压 入 栈 中 。 


初始 状态 : float 














float 
最 终 状 态 : float 
float 

fload_0(0x22) 从 局 部 变量 0 加 载 float 

概要 : 从 局 部 变量 0 中 加 载 单字 float 浮 点 数 并 压 人 堆栈 中 。 
占用 的 字 节 数 更 少 且 速度 更 快 。 

初始 状态 ; 一 

最 终 状 态 ; float 

fload_1(0x23) 一 一 从 局 部 变量 1 加 载 float 

概要 : 从 局 部 变量 1 中 加 载 单字 float 浮 点 数 并 压 人 堆栈 中 。 
占用 的 字 节 数 更 少 且 速度 更 快 。 

初始 状态 ， 一 

最 终 状 态 : float 

fload_2(0x24) 一 一 从 局 部 变量 2 加 载 float 

概要 : 从 局 部 变量 2 中 加 载 单字 float 浮 点 数 并 压 入 堆栈 中 。 
占用 的 字 节 数 更 少 且 速度 更 快 。 

初始 状态 ; 一 

最 终 状 态 ， float 

fload_3(0x25) 一 一 从 局 部 变量 3 加 载 float 

概要 : 从 局 部 变量 3 中 加 载 单字 float 浮 点 数 并 压 人 堆栈 中 。 
占用 的 字 节 数 更 少 且 速 度 更 快 。 


初始 状态 : 一 
最 终 状 态 ，float 
fneg(0x76) 一 一 foat 求 反 


此 功能 等 价 于 fioad 0， 但 它 


此 功能 等 价 于 fload 1, 但 它 


此 功能 等 价 于 fload 2， 但 它 


此 功能 等 价 于 fload 3， 但 它 


概要 : 弹出 一 个 float 浮 点 数 ， 符 号 求 反 〈 乘 以 -1) 后 压 人 栈 中 。 


初始 状态 ， float 
最 终 状 态 : float 


frem(Ox72) float 求 余 





概要 : 弹出 两 个 单字 的 float 浮 点 数 ， 并 将 float 一 ! 除 float-2 的 余数 压 人 栈 中 。 


初始 状态 ; float 一 1 
float—2 
最 终 状 态 : float 
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freturn(0xae) 一 一 从 方法 中 返回 float 

概要 : 从 当前 方法 栈 中 弹出 单字 的 float 浮 点 数 并 压 入 到 调用 者 环境 中 的 方法 栈 。 当 前 方 
法 被 终止 ， 控 制 转移 到 调用 者 环境 中 。 

初始 状态 ; float 

最 终 状态 : (n/a) 

fstore<varnum>(0x38)[byte/short] 一 一 存储 float 到 局 部 变量 中 

概要 : 从 堆栈 中 弹出 一 个 float 并 将 其 存储 到 第 <varnum> 个 局 部 变量 中 。 在 不 使 用 宽 
(wide) 操 作 数 前 缀 的 情况 下 ，<varnum> 的 值 是 一 个 0...255 范 围 的 byte。 否 则 为 0...65536 范 围 的 
Short 。 

初始 状态 : float 

最 终 状 态 ; 一 

fstore_0(0x43) 一 一 存储 float 到 局 部 变量 0 中 

概要 :从 栈 顶 弹出 一 个 float 并 存储 到 局 部 变量 0 中 。 此 功能 等 价 于 fstore 0, 但 它 占用 的 
字 节 数 更 少 且 速度 更 快 。 

初始 状态 : float 

最 终 状 态 ; 一 

fstore_1(0x44) 一 一 存储 float 到 局 部 变量 1 中 

概要 : 从 栈 顶 弹出 一 个 float 并 存储 到 局 部 变量 1 中 。 此 功能 等 价 于 fstore 1, 但 它 占 用 的 
字 节 数 更 少 且 速度 更 快 。 

初始 状态 : float 

最 终 状 态 : 一 

fstore_2(0x45) 一 一 存储 float 到 局 部 变量 2 中 

概要 : 从 栈 顶 弹出 一 个 float 并 存储 到 局 部 变量 2 中 。 此 功能 等 价 于 fstore 2, 但 它 占 用 的 
字 节 数 更 少 且 速度 更 快 。 

初始 状态 : float 

最 终 状 态 ; 一 

fstore_3(0x46) 一 一 存储 float 到 局 部 变量 3 中 

概要 :从 栈 顶 弹出 一 个 float 并 存储 到 局 部 变量 #3 中 。 此 功能 等 价 于 fstore 3, 但 它 占 用 
的 字 节 数 更 少 且 速度 更 快 。 

初始 状态 : float 

最 终 状 态 : 一 

fsub(0x67) 一 一 float 减 法 

概要 : 弹出 两 个 单字 的 float 浮 点 数 ， 并 将 float 一 2 减 float 一 1 的 结果 压 入 栈 中 。 

初始 状态 ; float 一 1 

float—2 

最 终 状态 : float 

getfield<fieldname><type>(0xb4[shortl[shor]) 获得 对 象 域 

概要 : 从 堆栈 中 弹出 一 个 地 址 〈 对 象 引用 ) ， 获 得 指定 域 值 并 压 入 栈 中 。getfie1d 操 作 码 
带 有 两 个 参数 ， 域 标识 符 和 域 类 型 ， 它 们 作为 2 个 字 节 的 常数 了 地 索引 存储 在 字 节 码 中 。 不 同 于 
Java 的 是 ， 域 名 必须 完全 限定 ， 包 括 相 关 的 类 和 包 名 。 

初始 状态 : 地 址 (对象 ) 
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最 终 状态 : 值 

getfield2_quick(0xd0) 一 一 用 于 双 字 域 的 getfie1d 的 快速 版 本 

概要 : Sun 公司 的 JIT 编 译 器 中 内 部 使 用 的 getfie1d 操 作 码 的 优化 版 本 。 这 一 操作 码 不 会 
在 目前 未 加 载 和 执行 的 .class 文 件 中 出 现 。 

初始 状态 : 参见 getfie1d 操 作 码 

最 终 状 态 : 参见 getfie1d 操 作 码 

getfield_quick(0xce) 一 一 getfie1d 操 作 码 的 快速 版 本 

概要 : ”Sun 公司 的 JIT 编 译 器 中 内 部 使 用 的 getfie1d 操 作 码 的 优化 版 本 。 这 一 操作 码 不 会 
在 上 生前 未 加 载 和 执行 的 .class 文 件 中 出 现 。 

初始 状态 : 参见 getfie1d 操 作 码 

最 终 状态 : 参见 getfie1d 操 作 码 

getfield_quick_w(0xe3) 一 一 getfield 的 快速 宽 版 本 

概要 : Sun 公司 的 JIT 编 译 器 中 内 部 使 用 和 的 getfie1d 操 作 码 的 优化 版 本 。 这 一 操作 码 不 会 
在 目前 未 加 载 和 执行 的 .class 文 件 中 出 现 。 

初始 状态 : 参见 getfie1d 操 作 码 

最 终 状态 : 参见 getfie1d 操 作 码 

getstatic<fieldname><type>(0xb2[short][short]) 一 一 获得 类 域 

概要 : 获得 指定 类 域 的 值 并 压 入 栈 中 。getstatic 操 作 码 带 有 两 个 参数 ， 域 标识 符 和 域 类 
型 ， 它 们 作为 2 个 字 节 的 常数 池 索 引 存 储 在 字 节 码 中 。 不 同 于 Java 的 是 ， 域 名 必须 完全 限定 ， 
包括 相关 的 类 和 包 名 。 

初始 状态 : 一 

最 终 状态 : 值 

getstatic_quick(0xd2) 一 一 getstatic 操 作 码 的 快速 版 本 

概要 : Sun 公司 的 JIT 编 译 器 中 内 部 使 用 的 getstatic 操 作 码 的 优化 版 本 。 这 一 操作 码 不 
会 在 目前 未 加 载 和 执行 的 .class 文 件 中 出 现 。 

初始 状态 : 参见 getstatic 操 作 码 

最 终 状态 : 参见 getstatic 操 作 码 

getstatic2_quick(0xd4) 一 一 用 于 2 字 节 getstatic 操 作 码 的 快速 版 本 

概要 :” ”Sun 公司 的 IT 编 译 器 中 内 部 使 用 的 getstatic 操 作 码 的 优化 版 本 。 这 一 操作 码 不 
会 在 目前 未 加 载 和 执行 的 .class 文 件 中 出 现 。 

初始 状态 参见 getstatic 操 作 码 

最 终 状态 ， 参见 getstatic 操 作 码 

goto<label>(0xa7[short]) 一 一 无 条 件 跳 转 到 label 处 

概要 : 无 条 件 地 将 控制 转移 到 <label> 标 识 的 位 置 。 在 指令 字 节 码 中 ， 操 作 码 的 后 面 是 相 
对 于 当前 PC 值 的 两 个 字 节 的 偏 移 量 。 如 果 标 识 的 偏 移 量 大 于 两 个 字 节 的 表示 ， 可 以 使 用 
goto_w。jasmin 汇 编 器 能 够 基于 偏 移 量 的 分 析 决 定 使 用 哪个 操作 码 。 

初始 状态 : 一 

最 终 状态 : 一 

goto_w<label>(0xa7[short]) 使 用 宽 偏 移 量 无 条 件 跳 转 到 label 处 

概要 :， 无 条 件 地 将 控制 转移 到 <label> 标 识 的 位 置 。 在 指令 字 节 码 中 ， 操 作 码 的 后 面 是 相 
对 于 当前 PC 值 的 四 个 字 节 的 偏 移 量 。 使 用 此 操作 码 ， 可 以 跳 转 到 超过 32 767 字 节 的 偏 移 量 处 。 
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jasmin 汇 编 器 能 够 基于 偏 移 量 的 分 析 自 动 决定 使 用 goto 还 是 goto_w 操 作 码 。 
初始 状态 ;一 
最 终 状 态 : 一 
ij2b(0x91) 一 一 将 integer 转 换 为 byte 
概要 :从 栈 中 弹出 单字 的 integer， 将 其 截断 为 一 个 byte(0...255) ,高 位 填 0 扩 展 为 32bit， 并 
压 人 栈 中 〈 作 为 一 个 integer) 。 
初始 状态 ; int 
最 终 状 态 ; int 
ij2c(0x87) 将 integer 转 换 为 char 
概要 ， 从 栈 中 弹出 单字 的 integer， 将 其 截断 为 一 个 两 字 节 的 UTF 一 16 char， 高 位 填 0 扩 展 
为 32bit， 并 压 入 栈 中 (作为 一 个 integer)。 
初始 状态 : int 
最 终 状 态 : int 
i2d(0x87) 一 一 将 integer 转 换 为 double 
概要 : 从 栈 中 弹出 单字 的 integer， 将 其 转换 为 双 字 的 double 并 压 人 栈 中 。 
初始 状态 :integer 
最 终 状 态 ; double 
double 
i2f(0x86) 将 integer 转 换 为 Hoat 
概要 : 从 栈 中 弹出 单字 的 integer， 将 其 转换 为 单字 的 浮 点 数 并 压 人 栈 中 。 
初始 状态 : integer 
最 终 状态 : float 
i21(0x85) 一 一 将 integer 转 换 为 long 
概要 : 从 栈 中 弹出 单字 的 integer， 将 其 符号 扩展 为 一 个 双 字 的 long 并 压 人 栈 中 。 
初始 状态 : int 
最 终 状 态 ; long 
long 
i2s(0x93) 将 integer 转 换 为 short 
概要 : 从 栈 中 弹出 单字 的 integer， 将 其 截断 为 一 个 有 符号 的 short( 一 32768...32767) 并 符号 
扩展 为 32bit， 压 入 栈 中 (作为 一 个 integer)。 
初始 状态 : int 
最 终 状 态 : int 
iadd(0x60) 一 一 integer 加 法 
概要 ， 从 栈 中 弹出 两 个 integer， 计 算 其 和 并 压 入 栈 中 。 
初始 状态 : int 
int 
最 终 状 态 : int 














iaload(0x2e) 从 integer 数 组 中 加 载 值 
概要 : 从 堆栈 中 弹出 一 个 数组 和 integer， 取 出 一 维 integer 数 组 中 指定 位 置 的 值 并 压 入 
栈 顶 。 


初始 状态 int (索引 ) 
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address( 数 组 引用 ) 
最 终 状 态 : int 
iand(Ox7e) integer 逻 辑 与 
概要 : 从 栈 中 弹出 两 个 integer， 计 算 位 与 的 结果 ， 并 将 32--bit 的 inateger 结 果 压 人 栈 中 。 
初始 状态 ; int 
int 
最 终 状 态 ; int 
iastore(Ox4f) 存储 值 到 integer 数 组 中 
概要 ， 将 单字 的 integer 存 储 到 integer 数 组 中 。 顶 端 所 弹出 的 参数 为 定义 所 用 位 置 的 索引 。 
第 二 个 弹出 的 参数 为 需 存储 的 integer 值 ， 第 三 个 (最 后 一 个 ) 参数 为 数组 本 身 。 
初始 状态 : int (索引 ) 
int ( 值 ) 
address (数组 引用 ) 
最 终 状态 ; 一 
iconst_0(0x03) 一 一 压 入 integer 常 量 0 
概要 ， 将 32 一 bit 的 integer 常 量 0 (0x0) 压 入 操作 数 栈 中 。 
初始 状态 ; 一 
最 终 状态 :int(0) 
iconst_1(0x4) 一 一 压 入 integer 常 量 1 
概要 : 将 32 一 bit 的 integer 常 量 1 (0x1) 压 入 操作 数 栈 中 。 
初始 状态 ; 一 
最 终 状 态 ; int(1) 
iconst_2(0x5) 一 一 压 入 integer 常 量 2 
概要 ， 将 32 一 bit 的 integer 常 量 2 (0x2) 压 入 操作 数 栈 中 。 
初始 状态 : 一 
最 终 状 态 : int(2) 
iconst _3(0x6)- 一 一 讨 入 integer 常 量 3 
概要 : 将 32 一 bit 的 integer 常 量 3 (0x3) 压 人 操作 数 栈 中 。 
初始 状态 ; 一 
最 终 状 态 : int(3) 
iconst_4(0x7) 一 一 压 入 integer 常 量 4 
概要 :将 32 一 bit 的 integer 常 量 4 (0x4) 压 入 操作 数 栈 中 。 
初始 状态 ; 一 
最 终 状 态 : int(4) 
iconst _5(0x8) 一 一 压 入 integer 常 量 5 
概要 ， 将 32 一 bit 的 integer 常 量 5 (0x5) 压 人 操作 数 栈 中 。 
初始 状态 : 一 
最 终 状 态 : int(5) 
iconst_m1(0x2) 一 一 压 入 integer 常 量 一 1 
概要 : 将 32 一 bit 的 integer 常 量 -1 (0xFFFF) 压 入 操作 数 栈 中 。 
初始 状态 ;一 
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最 终 状态 :int( 一 1) 
idiv(Ox6c) integer 除 法 
概要 : 弹出 两 个 单字 的 integer 浮 点 数 ， 并 将 integer 一 1 除 integer 一 2 的 结果 压 入 栈 中 。 
初始 状态 ; int 一 1 
int—2 
最 终 状态 : int 
if_acmpeq<label>(0xa5[shomrj) 一 一 比较 地 址 ， 相 等 则 跳 转 
概要 : 将 两 个 地 址 (对象 引用 ) 从 操作 数 栈 中 弹出 ， 如 果 二 者 相等 ， 控 制 转移 到 <label> 
在 内 部 ， 操 作 码 后 为 2 个 字 节 的 偏 移 量 。 当 产生 跳 转 时 ， 偏 移 量 会 加 到 当前 的 PC 值 上 。 
初始 状态 : address 
address 
最 终 状 态 ， 一 
if_acmpne<label>(0xa6[short]) 一 一 比较 地 址 ， 不 相等 则 跳 转 
概要 :将 两 个 地 址 (对象 引用 ) 从 操作 数 栈 中 弹出 ， 如 果 二 者 不 相等 ， 控 制 转移 到 
<label> 处 。 在 内 部 ， 操 作 码 后 为 2 个 字 节 的 偏 移 量 。 当 产生 跳 转 时 ， 偏 移 量 会 加 到 当前 的 PC 
值 上 。 
初 始 状态 : address 
address 
最 终 状 态 : 一 
if_icmpeq<label>(0x9ffshort) 一 一 比较 integer， 相 等 则 跳 转 
概要 : 将 两 个 integer 从 操作 数 栈 中 弹出 ， 如 果 二 者 相等 ， 控 制 转移 到 <label> 处 。 在 内 部 ， 
操作 码 后 为 2 个 字 节 的 偏 移 量 。 当 产生 跳 转 时 ， 偏 移 量 会 加 到 当前 的 PC 值 上 。 
初始 状态 ; int 
int 
最 终 状态 : 一 
if_icmpge<label>(0xa2[short) 一 一 比较 integer， 大 于 等 于 则 跳 转 
概要 : 将 两 个 integer 从 操作 数 栈 中 弹出 ， 如 果 倒 数 第 二 个 元 素 大 于 等 于 栈 顶 元 素 ， 控 制 
转移 到 <label> 处 。 在 内 部 ， 操 作 码 后 为 2 个 字 节 的 偏 移 量 。 当 产生 跳 转 时 ， 偏 移 量 会 加 到 当前 
的 PC 值 上 。 
初始 状态 : int 
int 
最 终 状态 : 一 
if_icmpgt<label>(0xa3[short]) 一 一 比较 integer， 大 于 则 跳 转 
概要 : 将 两 个 integer 从 操作 数 栈 中 弹出 ， 如 果 倒 数 第 二 个 元 素 大 于 栈 顶 元 素 ， 控 制 转移 
到 <label> 处 。 在 内 部 ， 操 作 码 后 为 2 个 字 节 的 偏 移 量 。 当 产生 跳 转 时 ， 偏 移 量 会 加 到 当前 的 
PC 值 上 。 
初始 状态 ; int 
int 
最 终 状 态 : 一 
i_icmple<label>(0xa2[short]) 一 一 比较 integer， 小 于 等 于 则 踏 转 
概要 : 将 两 个 integer 从 操作 数 栈 中 弹出 ， 如 果 倒 数 第 二 个 元 素 小 于 等 于 栈 顶 元 素 ， 控 制 
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转移 到 <label> 处 。 在 内 部 ， 操 作 码 后 为 2 个 字 节 的 偏 移 量 。 当 产生 跳 转 时 ， 偏 移 量 会 加 到 当前 
的 PC 值 上 。 

初始 状态 :int? 

int 

最 终 状态 : 一 

if_icmplt<label>(0xaf[shortJ) 一 一 比较 integer， 小 于 则 跳 转 

概要 : 将 两 个 integer 从 操作 数 栈 中 弹出 ， 如 果 倒 数 第 二 个 元 素 小 于 栈 顶 元 素 ， 控 制 转移 
到 <label> 处 。 在 内 部 ， 操 作 码 后 为 2 个 字 节 的 偏 移 量 。 当 产生 跳 转 时 ， 偏 移 量 会 加 到 当前 的 
PC 值 上 。 


最 终 状态 : 一 

if_icmpne<label>(0xa0[shor) 一 一 比较 integer， 不 相等 则 跳 转 

概要 : 将 两 个 integer 从 操作 数 栈 中 弹出 ， 如 果 二 者 不 相等 ， 控 制 转移 到 <label> 处 。 在 内 
部 ， 操 作 码 后 为 2 个 字 节 的 偏 移 量 。 当 产生 跳 转 时 ， 偏 移 量 会 加 到 当前 的 PC 值 上 。 

初始 状态 : int 

int 

最 终 状态 : 一 

jfeq<label>(0x99[short]) 一 一 相等 则 跳 转 

概要 : 将 一 个 integer 从 操作 数 栈 中 弹出 ， 如 果 等 于 0， 控 制 转移 到 <label> 处 。 在 内 部 ， 操 
作 码 后 为 2 个 字 节 的 偏 移 量 。 当 产生 跳 转 时 ， 偏 移 量 会 加 到 当前 的 PC 值 上 。 

初始 状态 : int 

最 终 状 态 : 一 

ifge<label>(0x9c[short]) 一 一 大 于 等 于 则 跳 转 

概要 : 将 一 个 integer 从 操作 数 栈 中 弹出 ， 如 果 大 于 等 于 0， 控 制 转移 到 <label> 处 。 在 内 部 ， 
操作 码 后 为 2 个 字 节 的 偏 移 量 。 当 产生 跳 转 时 ， 偏 移 量 会 加 到 当前 的 PC 值 上 。 

初始 状态 ; int 

最 终 状 态 ; 一 

if_gt<label>(0x9d[short]) 一 一 大 于 则 跳 转 

概要 : 将 一 个 integer 从 操作 数 栈 中 弹出 ， 如 果 大 于 0， 控 制 转移 到 <label> 处 。 在 内 部 ， 操 
作 码 后 为 2 个 字 节 的 偏 移 量 。 当 产生 跳 转 时 ， 偏 移 量 会 加 到 当前 的 PC 值 上 。 

初始 状态 : int 

最 终 状 态 : 一 

if_le<label>(O0x9e[short]) 小 于 等 于 则 跳 转 

概要 : 将 一 个 integer 从 操作 数 栈 中 弹出 ， 如 果 小 于 等 于 0， 控制 转 移 到 <label> 处 。 在 内 部 ， 
操作 码 后 为 2 个 字 节 的 偏 移 量 。 当 产生 跳 转 时 ， 偏 移 量 会 加 到 当前 的 PC 值 上 。 

初始 状态 ; int 

最 终 状 态 : 一 ， 

if_lt<label>(0x9b[short]) 小 于 则 跳 转 

概要 : 将 一 个 integer 从 操作 数 栈 中 弹出 ， 如 果 小 于 0， 控 制 转移 到 <label> 处 。 在 内 部 ， 操 
作 码 后 为 2 个 字 节 的 偏 移 量 。 当 产生 跳 转 时 ， 偏 移 量 会 加 到 当前 的 PC 值 上 。 
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初始 状态 ; int 

最 终 状 态 : 一 

if_ne<label>(0x9a[short]) 不 相等 则 跳 转 

概要 : 将 一 个 integer 从 操作 数 栈 中 弹出 ， 如 果 不 等 于 0， 控 制 转移 到 <label> 处 。 在 内 部 ， 
操作 码 后 为 2 个 字 节 的 偏 移 量 。 当 产生 跳 转 时 ， 偏 移 量 会 加 到 当前 的 PC 值 上 。 

和 初始 状态 :int 

最 终 状 态 : 一 

if_nonnull<label>(Oxc7[short]) 不 为 null 则 跳 转 

概要 : 将 一 个 地 址 (对象 引 用 ) 从 操作 数 栈 中 弹出 ， 如 果 不 为 mull， 控制 转移 到 <label> 处 。 
在 内 部 ， 操 作 码 后 为 2 个 字 节 的 偏 移 量 。 当 产生 跳 转 时 ， 偏 移 量 会 加 到 当前 的 PC 值 上 。 

初始 状态 ; address 

最 终 状 态 ; 一 

ifnull<label>(0xc6[shor]) 一 一 为 null 则 跳 转 

概要 : 将 一 个 地 址 〈 对 象 引 用 ) 从 操作 数 栈 中 弹出 ， 如 果 为 null， 控 制 转移 到 <label> 处 。 
在 内 部 ， 操 作 码 后 为 2 个 字 节 的 偏 移 量 。 当 产生 跳 转 时 ， 偏 移 量 会 加 到 当前 的 PC 值 上 。 

初始 状态 : address 

最 终 状 态 : 一 

iinc<varnum> <increment> (0x84[byte/short] [byte/short]) 一 一 递增 局 部 变量 中 的 
integer 

概要 : 将 包含 一 个 增 量 的 局 部 变量 递增 。 第 一 个 参数 定义 要 调整 的 局 部 变量 编号 ， 第 二 
个 参数 为 所 调整 的 有 符号 常量 。 第 一 个 参数 的 范围 为 0...255， 第 二 个 参数 的 范围 为 -128...127。 
如 果 使 用 wide 前 级 ， 第 一 个 参数 的 范围 为 0...6$5536， 第 二 个 参数 的 范围 为 -32768...32767。 堆 
栈 不 发 生变 化 。 

初始 状态 : 一 

最 终 状态 : 一 

iload<varnum>(0x15[byte/short]) 一 一 从 局 部 变量 中 加 载 integer 

概要 : 从 第 <varnum> 个 局 部 变量 中 加 载 单字 的 integer 并 压 入 堆栈 。 在 不 使 用 宽 (wide) 操 
作 数 前 级 的 情况 下 ，<varnum> 的 值 是 一 个 0...255 范 围 的 byte。 否 则 为 0...65536 范 围 的 short。 

初始 状态 : 一 

最 终 状态 : int 

iload_0(0x1a) 一 一 从 局 部 变量 0 加 载 integer 

概要 : 从 局 部 变量 0 中 加 载 单 字 integer 并 压 人 堆栈 中 。 此 功能 等 价 于 i1oad 0, 但 它 占 用 
的 字 节 数 更 少 且 速度 更 快 。 

初始 状态 ; 一 

最 终 状态 : int 

iload_1(0x1b) 一 一 从 局 部 变量 1 加 载 integer 

概要 : 从 局 部 变量 1 中 加 载 单 字 integer 并 压 人 堆栈 中 。 此 功能 等 价 于 i1oad 1, 但 它 占 用 
的 字 节 数 更 少 且 速 度 更 快 。 

初始 状态 : 一 

最 终 状 态 ; int 
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iload_2(0x1c) 一 一 从 局 部 变量 2 加 载 integer 

概要 : 从 局 部 变量 2 中 加 载 单 字 integer 并 压 和 人 堆栈 中 。 此 功能 等 价 于 1i1oad 2, 但 它 占用 
的 字 节 数 更 少 且 速度 更 快 。 

初始 状态 : 一 

最 终 状态 :， int 

iload_3(0x1d) 一 一 从 局 部 变量 3 加 载 integer 

概要 : 从 局 部 变量 3 中 加 载 单 字 integer 并 压 和 人 堆栈 中 。 此 功能 等 价 于 i1oad 3， 但 它 占 用 
的 字 节 数 更 少 且 速 度 更 快 。 

初始 状态 ， 一 

最 终 状态 ， int 

imdep1(0xfe) 一 一 保留 的 操作 码 

概要 ; 这 一 操作 码 保留 为 JVM 实 现 的 内 部 使 用 。 这 一 操作 码 出 现在 .cTass 文 件 中 是 非法 
的 并 且 这 样 的 类 文件 会 校 验 失败 。 

初始 状态 (n/a) 

最 终 状 态 : (n/a) 

imdep2(0xff) 一 一 保留 的 操作 码 

概要 : 这 一 操作 码 保留 为 JVM 实 现 的 内 部 使 用 。 这 一 操作 码 出 现在 . class 文 件 中 是 非法 
的 并 且 这 样 的 类 文件 会 校 验 失败 。 

初始 状态 : (n/a) 

最 终 状 态 : (n/a) 

imul(0x68) 一 一 integer 乘 法 

概要 : 弹出 两 个 integer， 并 将 二 者 的 乘积 压 和 人 栈 中 。 

初始 状态 : int 

int 

最 终 状 态 : int 

ineg(0x74) integer 求 反 

概要 :弹出 一 个 integer， 符 号 求 反 ( 乘 以 -1) 后 压 入 栈 中 。 

初始 状态 :， int 

最 终 状 态 ; int 

instanceof<type>(0xc1[short]) 一 一 检测 对 和 象 /数组 是 否 为 指定 类 型 

概要 :从 栈 中 弹出 一 个 地 址 (对 象 或 数组 引用 ) 并 判断 是 否则 指定 的 type 兼 容 -- 或 者 为 
type 的 实例 ， 或 者 实现 了 那 一 接口 ， 或 者 为 type 父 类 的 实例 。 如 果 兼 容 ， 压 人 整数 1， 否 则 压 
入 0。 








初始 状态 ， address 

最 终 状态 : int 

instanceof_quick(0xe1) 一 一 instanceof 操 作 码 的 快速 版 本 

概要 : Sun 公司 的 JIT 编 译 器 中 内 部 使 用 的 instanceof 操 作 码 的 优化 版 本 。 这 一 操作 码 不 
会 在 目前 未 加 载 和 执行 的 .cTass 文 件 中 出 现 。 

初始 状态 ; 参见 instanceof 操 作 码 

最 终 状态 : 参见 jnstanceof 操 作 码 
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invokeinterface<method><Nargs>(0xb9[short] [byte] [byte]) 一 一 调用 接口 方法 
概要 ， 调用 接口 (相对 于 类 ) 中 定义 的 方法 。inyokeinterface 的 参数 包括 被 调用 方法 的 
完全 限定 名 (包括 接口 名 、 参 数 类 型 和 返回 类 型 和 参数 个 数 。 这 些 参 数 和 实现 接口 的 对 象 
地 址 (对象 引用 ) 一 起 从 栈 中 弹出 。 一 个 新 的 栈 帧 会 为 被 调用 环境 创建 ， 同 时 对 象 和 参数 也 
会 压 入 环境 栈 中 ， 控 制 转移 到 新 的 方法 /环境 。 在 方法 返回 时 ， 返 回 值 (由 return 给 出 ) 会 压 
人 到 调用 者 环境 栈 中 。 
在 字 节 码 中 ， 方 法 名 为 两 个 字 节 的 常数 池 (参见 词汇 表 ) 索引 。 下 一 个 字 节 为 参数 的 个 
数 (以 字 为 单位 ) ， 最 多 可 达 255 个 。 在 下 一 个 字 节 存储 值 0， 在 JVM 内 部 可 用 来 存储 哈 希 值 以 
加 快 方法 的 查找 速度 。 
初始 状态 : argN 
arg2 
argl 
address( 对 象 ) 
最 终 状 态 : (结果 ) 
invokeinterface_quick(0xda) 一 一 invokeinterface 操 作 码 的 快速 版 本 
概要 :Sun 公司 的 JIT 编 译 器 中 内 部 使 用 的 invokeinterface 操 作 码 的 优化 版 本 。 这 一 操 
作 码 不 会 在 目前 未 加 载 和 执行 的 .class 文 件 中 出 现 。 
初始 状态 : 参见 invokeinterface 操 作 码 
最 终 状 态 : 参见 invokeinterface 操 作 码 
invokenonvirtual_quick(0xda) 一 一 invokespecial 操 作 码 的 快速 版 本 
概要 : ”Sun 公司 的 JIT 编 译 器 中 内 部 使 用 的 invokespecial 操 作 码 的 优化 版 本 。 这 一 操作 
码 不 会 在 且 前 未 加 载 和 执行 的 .class 文 件 中 出 现 。 
初始 状态 ， 参见 invokespecial 操 作 码 
最 终 状 态 ; 参见 invokespecial 操 作 码 
invokespecial<method> (0xb7[short]) 一 一 调用 实例 方法 
概要 : 在 下 述 情况 下 使 用 invokespecial 调 用 对 象 中 的 实例 方法 : 
*。 实 例 初始 化 方法 <init> 
。this 的 私有 方法 
。this 父 类 中 的 方法 
这 一 操作 码 类 似 于 invokevirtual1。invokespecia1 的 参数 包括 调用 方法 的 完全 限定 名 
(包括 接口 名 、 参 数 类 型 和 返回 类 型 ) 和 参数 个 数 。 这 些 参数 和 相关 类 的 实例 地 址 (对象 引用 ) 
一 起 从 栈 中 弹出 。 一 个 新 的 栈 帧 会 为 被 调用 环境 创建 ， 同 时 对 象 和 参数 也 会 压 人 环境 栈 中 ， 
控制 转移 到 新 的 方法 /环境 。 在 方法 返回 时 ， 返 回 值 (由 return 给 出 ) 会 压 入 到 调用 者 环境 栈 
中 。 在 字 节 码 中 ， 方 法 名 为 两 个 字 节 的 常数 池 (参见 词汇 表 ) 索引 。 
初始 状态 ; argN 
arg2 
argl 
address (对 象 ) 
最 终 状 态 ; (结果 ) 
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invokestatic<method> (0xb8[short]) 一 一 调用 静态 方法 
概要 :调用 类 的 静态 方法 。invokestatic 的 参数 包括 调用 方法 的 完全 限定 名 (包括 接口 
名 、 参 数 类 型 和 返回 类 型 ) 和 参数 个 数 。 这 些 参 数 从 栈 中 弹出 。 一 个 新 的 栈 帧 会 为 被 调用 环 
境 创 建 ， 同 时 对 象 和 参数 也 会 压 入 环境 栈 中 ， 控 制 转移 到 新 的 方法 /环境 。 在 方法 返回 时 ， 返 
回 值 (由 return 给 出 ) 会 压 和 到 调用 者 环境 栈 中 。 在 字 节 码 中 ， 方 法 名 为 两 个 字 节 的 常数 池 
(参见 词汇 表 ) 索引 。 
初始 状态 ; argN 
arg2 
argl 
最 终 状 态 : (结果 ) 
invokestatic_quick(0xd9) 一 一 invokestatic 操 作 码 的 快速 版 本 
概要 : Sun 公 司 的 JIT 编 译 器 中 内 部 使 用 的 invokestatic 操 作 码 的 优化 版 本 。 这 一 操作 码 
不 会 在 目前 未 加 载 和 执行 的 .class 文 件 中 出 现 。 
初始 状态 ; 参见 invokestatic 操 作 码 
最 终 状 态 : 参见 invokestatic 操 作 码 
invokesuper_quick(0xd8) 一 一 invokespecial 操 作 码 的 快速 版 本 
概要 : Sun 公 司 的 JIT 编 译 器 中 内 部 使 用 的 invokespecia1 操 作 码 的 优化 版 本 。 这 一 操作 码 
不 会 在 目前 未 加 载 和 执行 的 .class 文 件 中 出 现 。 
初始 状态 : 参见 invokespecial 操 作 码 
最 终 状 态 : 参见 invokespecial 操 作 码 
invokevirtual<method> (0xb6[short]) 一 一 调用 实例 方法 
概要 : 调用 对 象 的 实例 方法 。invokevirtual 的 参数 包括 调用 方法 的 完全 标识 名 (包括 接 
口 名 、 参 数 类 型 和 返回 类 型 ) 和 参数 个 数 。 这 些 参 数 和 相关 类 的 实例 地 址 (对象 引用 ) 一 起 
从 栈 中 弹出 。 一 个 新 的 栈 帧 会 为 被 调用 环境 创建 ， 同 时 对 象 和 参数 也 会 压 入 环境 栈 中 ， 控 制 
转移 到 新 的 方法 /环境 。 在 方法 返回 时 ， 返 回 值 (由 return 给 出 ) 会 压 人 到 调用 者 环境 栈 中 。 
在 字 节 码 中 ， 方 法 名 为 两 个 字 节 的 常数 地 (参见 词汇 表 ) 索引 。 
初始 状态 : argN 
arg2 
arg1l 
address (对 象 ) 
最 终 状 态 : (结果 ) 
invokevirtual_quick(0xd6) 一 一 invokevirtual 操 作 码 的 快速 版 本  “. 
概要 : ”Sun 公司 的 JIT 编 译 器 中 内 部 使 用 的 invokevirtual 操 作 码 的 优化 版 本 。 这 一 操作 
码 不 会 在 目前 未 加 载 和 执行 的 .class 文 件 中 出 现 。 
初始 状态 : 参见 invokevirtual 操 作 码 
最 终 状 态 参见 invokevirtual 操 作 码 
invokevirtual_quick_w(0xe2) 一 一 invokevirtual 操 作 码 的 快速 版 本 ( 宽 索 引 ) 
概要 :Sun 公司 的 JIT 编 译 器 中 内 部 使 用 的 invokevirtua1 操 作 码 的 优化 版 本 。 这 一 操作 
码 不 会 在 目前 未 加 载 和 执行 的 .class 文 件 中 出 现 。 
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和 初始 状态 : 参见 invokevirtual 操 作 码 
最 终 状 态 : 参见 invokevirtual 操 作 码 
invokevirtualobject_quick(0xd6) 一 一 invokevirtua1 调 用 对 和 象 方法 的 快速 版 本 
概要 : ”Sun 公司 的 JIT 编 译 器 中 内 部 使 用 的 invokevirtua1 操 作 码 的 优化 版 本 。 这 一 操作 
码 不 会 在 目前 未 加 载 和 执行 的 .class 文 件 中 出 现 。 
初始 状态 参见 invokevirtual 操 作 码 
最 终 状 态 : 参见 invokevirtual 操 作 码 
ior(O0x80) 一 一 integer 逻 辑 或 
概要 :从 栈 中 弹出 两 个 integer， 计 算 它们 的 位 或 结果 并 作为 32 一 bit 的 整数 压 入 栈 中 。 
初始 状态 ; int 
int 
最 终 状态 : int 
irem(Ox70) integer 求 余 
概要 : 弹出 两 个 单字 的 integer， 并 将 int 一 1 除 int 一 2 的 余数 压 人 栈 中 。 这 一 操作 类 伺 于 C 或 
Java 的 % 运 算 。 
初始 状态 ; int 一 1 
int—2 
最 终 状 态 ; int 
ireturn(0xac) 一 一 从 方法 中 返回 integer 
概要 : 从 当前 方法 栈 中 弹出 一 个 integer 并 压 人 到 调用 者 环境 中 的 方法 栈 。 当 前 方法 被 终 
止 ， 控 制 转 移 到 调用 者 环境 中 。 
初始 状态 : int 
最 终 状 态 ， (n/a) 
ishl(Ox78) integer 左 移 
概要 : 弹出 两 个 integer， 将 栈 顶 下 的 第 二 个 元 素 左 移 栈 顶 元 素 低 6 位 所 示 的 次 数 ， 并 将 结 
果 压 入 栈 中 。 新 空 出 的 位 置 用 0 填充 。 这 相当 于 乘 2 操 作 ， 但 速度 会 更 快 。 
初始 状态 : int ( 移 位 ) 
int ( 值 ) 
最 终 状 态 : int 
ishr(Ox7a) integer 右 移 
概要 : 弹出 两 个 integer， 将 栈 项 下 的 第 二 个 元 素 右 移 栈 顶 元 素 低 6 位 所 示 的 次 数 ， 并 将 结 
果 压 入 栈 中 。 注 意 : 这 是 一 个 算数 移 位 ， 符 号 位 将 会 填充 到 新 空 出 的 位 置 中 。 
初始 状态 : int ( 移 位 ) 
int ( 值 ) 
最 终 状态 : int 
istore<varnum>(0x36)[byte/short] 一 一 存储 integer 到 局 部 变量 中 
概要 : 从 堆栈 中 弹出 一 个 integer 并 将 其 存储 到 第 <varnum> 个 局 部 变量 中 。 在 不 使 用 宽 
(wide) 操 作 数 前 级 的 情况 下 ，<varnum> 的 值 是 一 个 0...255 范 围 的 byte。 否 则 为 0...65536 范 围 的 
short。 
初始 状态 ; int 
最 终 状 态 : 一 
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istore_0(0x3b) 一 一 存储 integer 到 局 部 变量 0 中 
概要 : 从 栈 顶 弹出 一 个 integer 并 存储 到 局 部 变量 0 中 。 此 功能 等 价 于 jstore 0， 但 它 占 用 
的 字 节 数 更 少 且 速度 更 快 。 
初始 状态 : int 
最 终 状 态 : 一 
istore_1(0x3c) 一 一 存储 integer 到 局 部 变量 1 中 
概要 ， 从 栈 顶 弹出 一 个 integer 并 存储 到 局 部 变量 1 中 。 此 功能 等 价 于 istore 1， 但 它 占 用 
的 字 节 数 更 少 且 速度 更 快 。 
初始 状态 ; int 
最 终 状态 : 一 
istore_2(0x3d) 一 一 存储 integer 到 局 部 变量 2 中 
概要 : 从 栈 顶 弹出 一 个 integer 并 存储 到 局 部 变量 2 中 。 此 功能 等 价 于 istore 2， 但 它 占 用 
的 字 节 数 更 少 且 速度 更 快 。 
初始 状态 ; integer 
了 最终 状态 : 一 
istore_3(0x3e) 一 一 存储 integer 到 局 部 变量 3 中 
概要 : 从 栈 顶 弹出 一 个 integer 并 存储 到 局 部 变量 3 中 。 此 功能 等 价 于 istore 3, 但 它 占用 
的 字 节 数 更 少 且 速 度 更 快 。 
初始 状态 : int 
最 终 状态 : 一 
isub(0x64) 一 一 integer 减 法 
概要 : 弹出 两 个 integer， 计 算 栈 顶 下 的 第 二 个 元 素 和 栈 顶 元 素 的 差 值 并 压 人 栈 中 。 
初始 状态 : int 
int 
最 终 状 态 : int 
iushr(Ox7c) 无 符号 int 右 移 
概要 : 弹出 两 个 integer， 将 栈 顶 下 的 第 二 个 元 素 右 移 栈 顶 元 素 低 6 位 所 示 的 次 数 ， 并 将 结 
果 压 入 栈 中 。 注 意 ; 这 是 一 个 逻辑 移 位 ， 符 号 位 被 忽略 ，0 将 会 填充 到 新 空 出 的 位 置 中 。 
初始 状态 : int ( 移 位 ) 
int 〈 值 ) 
最 终 状态 : int 
ixor(Ox82) integer 逻 辑 异 或 
概要 : 从 栈 中 弹出 两 个 integer， 计 算 它 们 的 位 异 或 结果 并 作为 32 一 Bit 的 整数 压 人 栈 中 。 
初始 状态 :int 
int 
最 终 状 态 : int 
jsr_w<label>(0xc9 [int) 一 一 使 用 宽 偏 移 量 跳 转 到 子 过 程 
概要 : 将 下 一 指令 地 址 (PC+5，jsr_w 的 指令 长 度 为 5) 压 人 栈 中 ， 并 无 条 件 跳 转 到 
<label> 处 。 
初始 状态 : 一 
最 终 状 态 : address(locn) 
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jsr_w<label>(0xa8 [short) 一 一 跳 转 到 子 过 程 
概要 : 将 下 一 指令 地 址 (PC+3，jsr 的 指令 长 度 为 3) 压 入 栈 中 ， 并 无 条 件 跳 转 到 <label> 处 。 
初始 状态 : 一 
最 终 状 态 : address(locn) 
12f(0x89) 一 一 将 Iong 转 换 为 float 
概要 :从 栈 中 弹出 双 字 的 long， 将 其 转换 为 一 个 单字 的 float 并 压 和 人 栈 中 。 
初始 状态 : long 
long 
最 终 状 态 : float 
12i(0x88) 一 一 将 long 转 换 为 int 
概要 :从 栈 中 弹出 双 字 的 long ， 将 其 转换 为 一 个 单字 的 integer 并 压 入 栈 中 。 注 意 由 于 
long 的 原始 符号 位 丢失 ， 这 可 能 会 导致 符号 位 的 变化 。 
初始 状态 : long 
long 
最 终 状 态 : int 
ladd(0x61) 一 一 long 加 法 
概要 : 弹出 两 个 long， 计 算 其 和 并 压 人 栈 中 。 
初始 状态 : long-1 
long-1 
long-2 
long-2 
最 终 状 态 ; long 
long 
laload(Ox2f) 从 iong 数 组 中 加 载 值 
概要 ， 从 堆栈 中 弹出 一 个 数组 和 integer,- 取出 一 维 long 数 组 中 指定 位 置 的 值 并 压 人 校 项 。 
初始 状态 : int (索引 ) 
address( 数 组 引用 ) 
最 终 状 态 : long 
‘long 
land(Ox7Tf) long 逻 辑 与 
概要 :从 栈 中 弹出 两 个 long， 计 算 位 与 的 结果 ， 并 将 64 一 bit 的 long 结 果 压 入 栈 中 。 
初始 状态 : long-1 
long-1 








long-2 
long-2 
最 终 状 态 ; long 
long 
lastore(0x50) 一 一 存储 值 到 long 数 组 中 
概要 : 将 双 字 的 long 存 储 到 long 数 组 中 。 顶 端 所 弹出 的 参数 为 定义 所 用 位 置 的 索引 。 第 二 
/三 个 弹出 的 参数 为 需 存储 的 long 值 ， 最 后 一 个 参数 为 数组 本 身 。 
初始 状态 : int (索引) 
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long 
long 
address (数组 引用 ) 
最 终 状 态 ; 一 
lcmp(0x94) 一 一 比较 long 
概要 : 将 两 个 双 字 的 long 从 操作 数 栈 中 弹出 并 比较 。 如 果 long-2 大 于 long-1， 将 +1 压 人 
栈 中 ， 如 果 二 者 相等 ， 将 0 压 入 栈 中 ， 否 则 的 话 将 -1 压 和 人 栈 中 。 
初始 状态 : long-1 
long-1 
long-2 
long-2 
最 终 状 态 ，int 
lconst_0(0x9) 一 一 压 入 long 常 量 0 
概要 : 将 64 位 的 long 常 量 0 压 人 操作 数 栈 中 。 
初始 状态 ; 一 
最 终 状 态 : long(0) 
long(0) 
Iconst_1(0xa) 一 一 压 入 long 常 量 1 
概要 : 将 64 位 的 long 常 量 1 压 入 操作 数 栈 中 。 
初始 状态 ; 一 
最 终 状态 : long(1) 
long(1) 
ldc<constant>(0x12 [short] ) 一 一 加 载 单字 常量 
概要 ， 从 常数 池 (参见 词汇 表 ) 中 加 载 单字 值 并 压 入 栈 中 。<constant> 可 为 int、float 或 字 
符 串 ， 它 存储 在 常数 池 索 引 0...255 的 项 中 。 
初始 状态 ; 一 
最 终 状 态 ; word 
ldc2_w<constant>(0x14 [int] ) 一 一 加 载 双 字 常 量 
概要 : 从 常数 池 (参见 词汇 表 ) 中 加 载 双 字 值 并 压 人 栈 中 。<constant> 可 为 double 或 1ong， 
它 存储 在 常数 池 索 引 0.…65536 的 项 中 。 - 
初始 状态 ; 一 
最 终 状态 ，word 
ldc_quick(0xcb) 一 一 1dc 操 作 码 的 快速 版 本 
概要 :” ”Sun 公司 的 JIT 编 译 器 中 内 部 使 用 的 1dc 操 作 码 的 优化 版 本 。 这 一 操作 码 不 会 在 上 且 前 
未 加 载 和 执行 的 .class 文 件 中 出 现 。 
初始 状态 : 参见 1dc 操 作 码 
最 终 状 态 : 参见 1dc 操 作 码 
Idc_w<constant>(0x13 fint] ) 一 一 使 用 宽 索 引 加 载 单 字 常 量 
概要 : 从 常数 池 (参见 词汇 表 ) 中 加 载 单字 值 并 压 人 栈 中 。<constant> 可 为 int、float 或 字 
符 串 ， 它 存储 在 常数 池 索 引 0.…65536 的 项 中 。 
初始 状态 : 一 
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最 终 状 态 ; word 
ldc_w_quick(0xcd) 一 一 1dc_w 操 作 码 的 快速 版 本 
概要 : Sun 公 司 的 JIT 编 译 器 中 内 部 使 用 的 1dc_w 操 作 码 的 优化 版 本 。 这 一 操作 码 不 会 在 目 
前 未 加 载 和 执行 的 .class 文 件 中 出 现 。 
”初始 状态 参见 1dc_w 操 作 码 
最 终 状 态 : 参见 1dc_w 操 作 码 
Idiv(0x6d) 一 一 Iong 除 法 
概要 : 弹出 两 个 双 字 的 long， 并 将 long 一 1 除 long 一 2 的 结果 压 入 栈 中 。 
初始 状态 : long-1 
long-1 
long-2 
long-2 
最 终 状 态 : long 
long 
lload<varnum>(0x16[byte/short]) 一 一 从 局 部 变量 中 加 载 long 
概要 ， 从 第 <varnum> 和 <varnum+1> 个 局 部 变量 中 加 载 双 字 的 long 并 压 入 堆栈 。 在 不 使 用 
宽 (wide) 操 作 数 前 绥 的 情况 下 ，<varnum> 的 值 是 一 个 0...255 范 围 的 byte。 否 则 为 0...65536 范 围 
的 short。 
初始 状态 : 一 
最 终 状 态 ; long 
long 
lload_0(0x1e) 从 局 部 变量 0 和 1 加 载 long 
概要 : 从 局 部 变量 0 和 1 中 加 载 双 字 1l1ong 并 压 入 堆栈 中 。 此 功能 等 价 于 110ad 0， 但 它 占用 
的 字 节 数 更 少 且 速度 更 快 。 
初始 状态 : 一 
最 终 状态 ; long 
long 
iload_1(0x1f) 一 一 从 局 部 变量 1 和 2 加 载 long 
概要 ， 从 局 部 变量 1 和 2 中 加 载 双 字 long 并 压 入 堆栈 中 。 此 功能 等 价 于 110ad 1, 但 它 占用 
的 字 节 数 更 少 且 速 度 更 快 。 
初始 状态 : 一 
最 终 状 态 ; long 
long 
lload_2(0x20) 一 一 从 局 部 变量 2 和 3 加 载 long 
概要 从 局 部 变量 2 和 3 中 加 载 双 字 long 并 压 人 堆栈 中 。 此 功能 等 价 于 11oad 2, 但 它 占用 
的 字 节 数 更 少 且 速度 更 快 。 
初始 状态 : 一 
最 终 状 态 : long 
long 
lload_ 3(0x21) 从 局 部 变量 3 和 4 加 载 long 
概要 ; 从 局 部 变量 3 和 4 中 加 载 双 字 long 并 压 人 堆栈 中 。 此 功能 等 价 于 11oad 3, 但 它 占 用 
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的 字 节 数 更 少 且 速 度 更 快 。 
初始 状态 ; 一 
最 终 状态 :long 
long 
Imul(Ox69) long 乘 法 
概要 : 弹出 两 个 Iong， 并 将 二 者 的 乘积 压 人 栈 中 。 
初始 状态 : long-1 
long-1 





long-2 

long-2 
最 终 状 态 : long 

long 





Ineg(Ox75) long 求 反 

概要 : 弹出 一 个 long， 符 号 求 反 ( 乘 以 -1) 后 压 人 栈 中 。 

初始 状态 ; long 

最 终 状 态 ; long 

lookupswtich<args>(0xab [args] ) 一 一 多 路 跳 转 

概要 : 类 似 于 Java/C++ 中 的 Switch 语句 ， 执 行 一 个 多 路 跳 转 。 弹 出 栈 顶 的 integer 并 同一 
组 value:label 对 相 比较 。 如 果 integer 的 值 等 于 value 的 话 ， 控 制 转 1ookupswitch 


移 到 label 处 。 如 果 没 有 匹配 的 值 ， 控 制 转 移 到 缺 省 的 label 处 。 > : Te 
label 的 实现 采用 的 是 相对 偏 移 量 ， 把 它 的 值 加 到 当前 的 PC 上 ， : Three 


得 到 要 执行 指令 的 地 址 。 图 B-1 所 示 的 是 使 用 1ookupswitch 语 句 gu Elsewhere 
的 示例 。1ookupswitch 语 名 的 参数 个 数 不 定 ， 因 此 字 节 码 的 存 
储 上 有 一 点 复杂 。 在 操作 码 (0xab) 后 面 ， 有 0 到 3 个 填充 字 节 ， 图 B-1 lookupswitch 示 例 
以 使 得 4 字 节 的 缺 省 偏 移 量 的 开始 位 置 是 4 字 节 的 整数 倍 。 接 下 来 的 4 个 字 节 定义 的 是 
value:label 对 的 个 数 ， 每 一 对 按照 升序 排列 连续 存储 ， 其 中 包括 4 字 节 的 integer 和 4 字 节 的 偏 移 
量 ， 结 构 如 表 B-1 所 示 。 

初始 状态 ; int 

最 终 状态 ; 一 





表 B-1 lookupswitch 字 节 码 的 结构 


offset 1 


value 2 
offset 2 


value N 
offset N 
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lor(0x80) 一 一 long 逻 辑 或 
概要 : 从 栈 中 弹出 两 个 long， 计 算 它 们 的 位 或 结果 并 作为 64 一 bit 的 long 压 入 栈 中 。 
初始 状态 ， long-1 
long-1 
long-2 
long-2 
最 终 状 态 ; long 
long 
Irem(Ox70) long 求 余 
概要 : 弹出 两 个 单字 的 integer， 并 将 long 一 1 除 long 一 2 的 余数 压 入 栈 中 。 这 一 操作 类 似 于 C 
或 Java 的 % 运 算 。 
初始 状态 ， long-1 
long-1 





long-2 
long-2 
最 终 状 态 : long 
long 
Ireturn(Oxad) 从 方法 中 返回 long 
概要 ， 从 当前 方法 栈 中 弹出 一 个 双 字 的 long 并 压 入 到 调用 者 环境 中 的 方法 栈 。 当 前 方法 
被 终止 ， 控 制 转移 到 调用 者 环境 中 。 
初始 状态 : long 
long 
最 终 状态 : (n/a) 
lshl(0x79) 一 一 Iong 左 移 
概要 : 从 栈 中 弹出 一 个 integer 和 64-bit 的 long ， 将 long 左 移 integer 低 6 位 所 示 的 次 数 ， 并 将 
结果 压 人 栈 中 。 新 空 出 的 位 置 用 0 填充 。 这 相当 于 乘 2 操 作 ， 但 速度 会 更 快 。 
初始 状态 int ( 移 位 ) 
long 





long 
最 终 状 态 : long 
long 
lshr(0x7b) 一 一 Iong 右 移 
概要 : 从 栈 中 弹出 一 个 integer 和 64-bit 的 long， 将 long 右 移 integer 低 6 位 所 示 的 次 数 ， 并 将 
结果 压 入 栈 中 。 新 空 出 的 位 置 用 0 填充 。 这 相当 于 乘 2 操 作 ， 但 速度 会 更 快 。 注 意 : 这 是 一 个 
算术 移 位 ， 符 号 位 将 会 填充 到 新 空 出 的 位 置 中 。 
初始 状态 : int ( 移 位 ) 
long 
long 
最 终 状态 : long 
long 
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Istore<varnum>(0x37)[byte/short] 一 一 存储 long 到 局 部 变量 中 
概要 ， 从 堆栈 中 弹出 一 个 long 并 将 其 存储 到 第 #<varnum> 和 #<varnum+1> 个 局 部 变量 中 。 
在 不 使 用 宽 (wide) 操 作 数 前 缀 的 情况 下 ，<varnum> 的 值 是 一 个 0...255 范 围 的 byte。 否 则 为 
0...65536 范 围 的 short。 
初始 状态 : long 
long 
最 终 状 态 : 一 
lstore_0(0x3f) 一 一 存储 long 到 局 部 变量 0 和 1 中 
概要 : 从 栈 顶 弹出 一 个 long 并 存储 到 局 部 变量 0 和 1 中 。 此 功能 等 价 于 1store 0， 但 它 占 
用 的 字 节 数 更 少 且 速 度 更 快 。 
初始 状态 : long 
long 
最 终 状态 : 一 
lstore_1(0x40) 一 一 存储 long 到 局 部 变量 1 和 2 中 
概要 : 从 栈 顶 弹出 一 个 long 并 存储 到 局 部 变量 1 和 2 中 。 此 功能 等 价 于 1store 1, 但 它 占 
用 的 字 节 数 更 少 且 速 度 更 快 。 
初始 状态 ; int 
最 终 状态 ; 一 
Istore_2(0x41) 一 一 存储 long 到 局 部 变量 2 和 3 中 
概要 : 从 栈 顶 弹出 一 个 long 并 存储 到 局 部 变量 2 和 3 中 。 此 功能 等 价 于 1store 2, 但 它 占 
用 的 字 节 数 更 少 且 速度 更 快 。 
初始 状态 : long 
long 
最 终 状态 : 一 
Istore_3(0x42) 一 一 存储 long 到 局 部 变量 3 和 4 中 
概要 : 从 栈 顶 弹出 一 个 long 并 存储 到 局 部 变量 3 和 4 中 。 此 功能 等 价 于 1store 3， 但 它 占 
用 的 字 节 数 更 少 且 速度 更 快 。 
初始 状态 : long 
long 
最 终 状 态 ; 一 
Isub(0x65) 一 一 long 减 法 
概要 : 弹出 两 个 双 字 的 long， 计 算 栈 顶 下 的 第 二 个 元 素 和 栈 顶 元 素 的 差 值 并 压 人 栈 中 。 
初始 状态 ;: long-1 
long-1 
long-2 
long-2 
最 终 状 态 : long 
long 
lushr(Ox7d) 无 符号 long 右 移 
概要 : 弹出 一 个 integer 和 一 个 64-bit 的 long， 将 long 右 移 integer 低 6 位 所 示 的 次 数 ， 并 将 结 
果 压 入 栈 中 。 注 意 ; 这 是 一 个 逻辑 移 位 ， 符 号 位 被 忽略 ，0 将 会 填充 到 新 空 出 的 位 置 中 。 
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初始 状态 ， int ( 移 位 ) 
long 
long 
最 终 状 态 ; long 
long 
lxor(Ox83) long 逻 辑 异 或 
概要 ， 从 栈 中 弹出 两 个 long， 计 算 它们 的 位 异 或 结果 并 作为 64~bit 的 long 压 入 栈 中 。 
初始 状态 : long-1 
long-1 





long-2 
long-2 
最 终 状 态 ; long 
long 
monitorenter(Ox7d) 获得 对 象 锁 
概要 : JVM monitor 系 统 能 够 协调 并 同步 多 线程 对 对 象 的 访问 。monitorenter 从 栈 中 弹出 
一 个 地 址 (对象 引 用 ) 并 从 JVM 请 求 一 个 独占 的 对 象 锁 。 如 果 没 有 其 他 线程 锁定 该 对 象 ， 则 
发 放 该 对 象 锁 并 继续 执行 。 和 否则 的 话 线程 被 阻塞 并 停止 执行 ， 直 至 其 他 线程 通过 monitorexit 
释放 对 象 锁 。 
初始 状态 ; address 
最 终 状态 :一 
monitorexit(0xc3 一 一 释放 对 象 锁 
概要 ， 从 栈 中 弹出 一 个 地 址 (对象 引用 ) 并 释放 获得 的 〈 通 过 monitorenter) 对 象 锁 ， 以 
使 得 其 他 线程 能 够 获得 对 象 锁 。 
初始 状态 ; address 
最 终 状 态 ; 一 
multianewarray<type><N>(0xc5[shortl[byte]) 一 一 创建 多 维 数组 
概要 : 为 类 型 为 <type> 的 N 维 数组 分 配 空间 并 将 数组 引用 压 入 栈 中 。 字 节 码 中 存储 的 类 型 
为 2 字 节 的 常数 池 (参见 词汇 表 ) 索引 ， 维 数 N 为 0...255 的 一 个 字 节 。 操 作 码 的 执行 会 从 栈 中 
弹出 N 个 integer， 代 表 数 组 每 一 维 的 大 小 。 创 建 的 数组 实际 上 为 一 个 ( 子 ) 数组 的 数组 。 
初始 状态 : 维 数 N 
维 数 N 一 1 





维 数 1 

最 终 状 态 ; address 

multianewarray_quick(0xdf) 一 一 mu1tianewarray 操 作 码 的 快速 版 本 

概要 : Sun 公 司 的 JIT 编 译 器 中 内 部 使 用 的 multianewarray 操 作 码 的 优化 版 本 。 这 一 操作 
码 不 会 在 目前 未 加 载 和 执行 的 .cl1ass 文 件 中 出 现 。 

初始 状态 ; 参见 mu1tianewarray 操 作 码 

最 终 状 态 : 参见 multianewarray 操 作 码 

new<class>(0xbb[short]) 一 一 创建 新 对 象 

概要 : 创建 指定 类 的 新 对 象 。 字 节 码 中 存储 的 类 型 为 2 字 节 的 常数 池 (参见 词汇 表 ) 索引 。 


216 附录 B JVM 指 食 集 


初始 状态 ; 一 

最 终 状 态 : address (对 象 ) 

new_quick(0xdd) 一 一 new 操 作 码 的 快速 版 本 

概要 : Sun 公 司 的 JIT 编 译 器 中 内 部 使 用 的 new 操 作 码 的 优化 版 本 。 这 一 操作 码 不 会 在 目前 





未 加 载 和 执行 的 .class 文 件 中 出 现 。 


初始 状态 参见 new 操 作 码 

最 终 状态 : 参见 new 操 作 码 

newarray<typename>(0xbc[type-byte]) 一 一 创建 一 维 数组 

概要 ;为 类 型 为 <typename> 的 一 维 数组 分 配 空间 并 将 数组 引用 压 入 栈 中 。 字 节 码 中 存储 





的 类 型 为 2 字 节 的 常数 池 (参见 词汇 表 ) 索引 ， 新 数组 的 大 小 从 栈 中 弹出 ， 数 组 的 类 型 由 操作 
码 后 的 一 个 字 节 表示 ， 其 具体 含义 如 下 : 


boolean 4 byte 8 
char 5 short 9 
float 6 int 10 
double 7 long 11 


初始 状态 ， int (大 小 ) 

最 终 状 态 : address (数组 ) 

nop(Ox0) 空 操作 

概要 ， 空 操作 。 空 操作 主要 用 于 时 序 调整 、 调 试 和 将 来 代码 的 占 位 符 。 
初始 状态 :一 

最 终 状 态 : 一 

pop(0x57) 一 一 从 栈 中 弹出 单字 





概要 : 弹出 并 丢弃 掉 栈 顶 的 字 (一 个 integer、float 或 地 址 ) 。 注 意 : 没有 相对 应 的 push 指 


因为 压 栈 操作 是 与 类 型 相关 联 的 ， 如 : sipush 或 1dc。 

初始 状态 ; word 

最 终 状 态 : 一 

pop2(0x58) 一 一 从 栈 中 弹出 双 字 

概要 : 弹出 并 丢弃 掉 栈 顶 的 双 字 (可 以 是 两 个 单字 量 如 integer、float 或 地 址 ， 或 一 个 双 字 


量 如 long 求 double) 。 注 意 : 没有 相对 应 的 push 指 令 ， 因 为 压 栈 操 作 是 与 类 型 相关 联 的 ， 如 : 
sipush 或 1dc2_w。 


初始 状态 word 
word 
最 终 状 态 ; 一 
putfield<fieldname><type>(0xb5[short] [short] ) 一 一 对 象 域 赋值 
概要 : 从 栈 中 弹出 一 个 地 址 (对象 引用 ) 和 值 ， 并 将 值 存储 到 指定 的 对 象 域 中 。 


putfie1d 操 作 码 带 有 两 个 参数 ， 域 标识 符 和 域 类 型 ， 它 们 在 字 节 码 中 存储 为 ? 字 节 的 常数 池 
(参见 词汇 表 ) 索引 。 不 同 于 Java 的 是 ， 域 名 必须 是 完全 限定 名 ， 包 括 相 关 的 类 和 包 名 。 


初始 状态 : 值 
address (对 象 ) 
最 终 状 态 : 一 
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putfield2_quick(0xd1) 一 一 用 于 2 字 节 putfie1 d 操 作 码 的 快速 版 本 

概要 ， Sun 公 司 的 IT 编 译 器 中 内 部 使 用 的 putfie1d 操 作 码 的 优化 版 本 。 这 一 操作 码 不 会 
在 目前 未 加 载 和 执行 的 .class 文 件 中 出 现 。 

初始 状态 : 参见 putfie1d 操 作 码 

最 终 状 态 参见 putfie1d 操 作 码 

putfield_quick(0xcf) 一 一 putfie1d 操 作 码 的 快速 版 本 : 

概要 : Sun 公 司 的 JIT 编 译 器 中 内 部 使 用 的 putfie1d 操 作 码 的 优化 版 本 。 这 一 操作 码 不 会 
在 目前 未 加 载 和 执行 的 .class 文 件 中 出 现 。 

初始 状态 参见 putfie1d 操 作 码 

最 终 状 态 : 参见 putfie1d 操 作 码 

putfield_quick_w(0xe4) 一 一 宽 索引 putfie1d 操 作 码 的 快速 版 本 

概要 : Sun 公 司 的 JIT 编 译 器 中 内 部 使 用 的 putfield 操 作 码 的 优化 版 本 。 这 一 操作 码 不 会 
在 目前 未 加 载 和 执行 的 .class 文 件 中 出 现 。 

初始 状态 参见 putfie1d 操 作 码 

最 终 状 态 : 参见 putfie1d 操 作 码 

putstatic<fieldname><type>(0xb3[short] [short] ) 一 一 类 域 赋值 

概要 : 从 栈 中 弹出 一 个 地 址 〈 对 象 引用 ) 和 值 ， 并 将 值 存储 到 指定 的 类 域 中 。putstatic 
操作 码 带 有 两 个 参数 ， 域 标识 符 和 域 类 型 ， 它们 在 字 节 码 中 存储 为 2 字 节 的 常数 凶 〈 参 见 词汇 
表 ) 索引 。 不 同 于 Java 的 是 ， 域 名 必须 是 完全 限定 名 ， 包括 相关 的 类 和 包 名 。 

初始 状态 : 值 

最 终 状态 ; 一 

putstatic2_quick(0xd5) 一 一 putstatic 操 作 码 的 替代 快速 版 本 

概要 : Sun 公 司 的 JIT 编 译 器 中 内 部 使 用 的 putstatic 操 作 码 的 优化 版 本 。 这 一 操作 码 不 
会 在 目前 未 加 载 和 执行 的 .class 文 件 中 出 现 。 

初始 状态 : 参见 putstatic 操 作 码 

最 终 状 态 ， 参见 putstatic 操 作 码 

putstatic_quick(0xd3) 一 一 putstatic 操 作 码 的 快速 版 本 

概要 : Sun 公司 的 JIT 编 译 器 中 内 部 使 用 的 putstatic 操 作 码 的 优化 版 本 。 这 一 操作 码 不 
会 在 目前 未 加 载 和 执行 的 .class 文 件 中 出 现 。 

初始 状态 : 参见 putstatic 操 作 码 

最 终 状态 : 参见 putstatic 操 作 码 

ret<varnum>(0xa9 [byte/short]) 一 一 从 子 过 程 返回 

概要 : 在 通过 jsr 或 jsr_w 跳 转 到 子 过 程 后 ， 返 回 到 <varnum> 局 部 变量 中 存储 的 地 址 。 在 
不 使 用 宽 (wide) 操 作 数 前 级 的 情况 下 ， <varnum> 的 值 是 一 个 0...255 范 围 的 byte。 否 则 为 
0...65536 范 围 的 双 字 节 量 。 

初始 状态 : 一 

最 终 状 态 : 一 

return(Oxb1) 不 带 返 回 结 果 从 方法 返回 

概要 : 结束 当前 方法 并 将 控制 转移 回调 用 环境 。 
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初始 状态 : 一 
最 终 状 态 : (n/a) 
saload(0x56) 从 short 数 组 中 加 载 值 
概要 : 从 堆栈 中 弹出 一 个 数组 和 integer， 取 出 一 维 short 数 组 中 指定 位 置 的 16-bit 的 short 值 ， 
符号 扩展 成 一 个 integer 并 压 人 栈 顶 。 
初始 状态 ; int (索引 ) 
address( 数 组 引用 ) 
最 终 状 态 : int 
sastore(0x56) 一 一 存储 值 到 short 数 组 中 
概要 ， 将 16-bit 的 short 存 储 到 short 数 组 中 。 顶 端 所 弹出 的 参数 为 定义 所 用 位 置 的 索引 。 第 
二 个 弹出 的 参数 为 需 存储 的 short 值 ， 第 三 个 〈 最 后 一 个 ) 参数 为 数组 本 身 。 第 二 个 参数 由 int 
截断 为 short 并 存储 在 数组 中 。 
初始 状态 : int (索引 ) 
int (short) 
address (数组 引用 ) 
最 终 状态 : 一 
sipush<constant>(0x11 [short]) 一 一 将 [integer]short 压 入 栈 中 
概要 : 参数 short 的 值 (-32768...32767) 符 号 扩展 为 一 个 integer 并 压 人 栈 中 。 
初始 状态 : 一 
最 终 状 态 : int 
swap(0x5f) 一 一 交换 栈 顶 的 两 个 元 素 
交换 栈 顶 的 两 个 单字 的 元 素 。 遗 憾 的 是 不 存在 swap2 指 令 。 
初始 状态 : word-1 
word-2 
最 终 状 态 ; word-2 
word-1 
tableswtich<args>(0xaa [args] ) 一 一 多 路 跳 转 
概要 : 类似 于 Java/C++ 中 的 switch 语 名 ， 执 行 一 个 多 路 跳 转 。 弹 出 栈 顶 的 integer 并 同一 组 
value:label 对 相 比 较 。 如 果 integer 的 值 等 于 value 的 话 , 控制 转移 到 label 处 。 如 果 没 有 匹配 的 值 ， 
控制 转移 到 缺 省 的 label 处 。label 的 实现 采用 的 是 相对 偏 移 量 ， 把 它 的 值 加 到 当前 的 PC 上 ， 得 
到 要 执行 指令 的 地 址 。 这 一 指令 的 执行 比 100okupswitch 效 率 更 高 ， 但 要 求 值 必须 是 顺序 且 连 
续 的 。 
tableswitch 语 句 的 表 中 包括 最 小 和 最 大 值 。 如 果 从 栈 中 弹出 的 integer 小 于 最 小 值 或 大 于 最 
大 值 ， 则 控制 转移 到 缺 省 的 label 处 ， 否 则 ， 控 制 直接 转移 (不 需要 比较 ) 到 表 中 弹出 的 值 减 
掉 最 小 值 的 label 处 。 
图 B-2 所 示 的 是 使 用 的 tableswitch 语 句 的 示例 。 
tableswitch 语 名 的 参数 个 数 不 定 ， 因 此 字 节 码 的 存储 上 有 一 点 复杂 。 在 操作 码 (0xab) 
的 8 有 0 到 3 个 填充 字 节 ， 以 使 得 4 字 节 的 缺 省 偏 移 量 的 开始 位 置 是 4 字 节 的 整数 倍 。 接 下 来 
的 8 个 字 节 表示 表 中 的 最 小 值 和 最 大 值 ， 接 下 来 的 偏 移 量 顺序 存储 ， 每 个 包括 4 个 字 节 。 结 构 
如 表 B. 2 所 示 。 
初始 状态 ， int 
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最 终 状 态 : 一 


tableswitch 1 3 


One 

Two 

Three 
default:Elsewhere 





图 B-2 tableswitch 示 例 


表 B-2 tableswitch 字 节 码 的 结构 


操作 码 (0xaa) 和 填充 
缺 省 偏 移 量 


高 值 


offset 2 


wide(0xc4) 一 一 指定 下 一 个 操作 码 为 宽 索 引 

概要 : 这 是 一 个 操作 码 前 组 而 非 操 作 码 。 它 表示 下 一 操作 的 参数 有 可 能 比 正常 情况 要 大 
一 些 。 如 : 在 i10ad 中 使 用 大 于 255 的 局 部 变量 。jasmin 汇 编 器 在 需要 时 会 自动 生成 这 一 前 级 。 

初始 状态 : 一 

最 终 状 态 : 一 








附录 C 按 序号 排列 的 操作 代码 


C.1 标准 操作 代码 


Co DD- Oo 


Ox0 
Oxl 
Ox2 
Ox3 
Ox4 
Ox5 
0Ox6 
Ox7 
Ox8 
Ox9 
Oxa 
Oxb 
Oxc 
Oxd 
Oxe 
Oxf 
Ox10 
Oxll 
Ox12 
Ox13 
Ox14 
Ox15 
Ox16 
Ox17 
Ox18 
Ox19 
Oxla 
Oxlb 
Oxlc 
Oxld 
Oxle 
Ox1f 
Ox20 
Ox21 
Ox22 
Ox23 
Ox24 
Ox25 
0x26 
0x27 
Ox28 
Ox29 
Ox2a 
Ox2b 
Ox2c 
Ox2d 


nop 
aconst.nul] 
iconst_ml 
iconst_-06 
iconst_1 
iconst_2 
iconst_3 
iconst 4 
iconst.5 
lconst_0 
Tconst_1 
fconst-0 
fconst_1 
fconst_2 
dconst_0 
dconst_1 
bipush 
sipush 
1dc 
Tdc-w 
1dc2_w 
iload 
1l1load 
fload 
dload 
aload 
iload 6 
iload.1 
iload.2 
i1oad-3 
11oad-6 
lload_1 
11oad-_2 
11oad-3 
fload.0 
flioad_1 
fload_2z 
fl1oad_3 
doad-0 
dload_1 
dload.2 
d1oad-3 
aload.0 
aload-I 
aload-2z 
aload_3 


Ox2e 

Ox2f 

0x30 
Ox31 

0x32 
Ox33 

Ox34 
Ox35 
0x36 
Ox37 
Ox38 
Ox39 
Ox3a 
Ox3b 
0x3c 
Ox3d 
Ox3e 
Ox3f 
Ox40 
Ox41 
0x42 
Ox43 
Ox44 


Ox45 
0x46 
Ox47 
0x48 
Ox49 
Ox4a 
Ox4b 
Ox4c 
Ox4d 
Ox4e 
Ox4f 
Ox50 
Ox51 
Ox52 
Ox53 
Ox54 
Ox55 
Ox56 
Ox57 
Ox58 
Ox59 
Ox5a 
OxSb 


iaload 
laload 
faload 
daload 
aaload 
baload 
caload 
saload 
istore 
1store 
fstore 
dstore 
astore 
istore-0 
istore_1 
TSstore-2 
Tstore-3 
1store-0 
1store-1 
1store_2 
1store_3 
fstore-0 
fstore-1 


fstore.2 
fstore-3 
dstore-0 
dstore_1 
dstore.2 
dstore-3 
astore-0 
astore_1 
astore_2 
astore_3 
iastore 
lastore 
fastore 
dastore 
aastore 
bastore 
castore 
sastore 
pop 
pop2 

dup 
dup_x1 
dup_x2 


92 
93 
94 
95 
96 
97 
98 
99 
100 
101 
102 
103 
104 
105 
106 
107 
108 
109 
110 
111 
112 
113 
114 
115 
116 
117 
118 
119 
120 
121 
122 
123 
124 
125 
126 
127 
128 
129 
130 
131 
132 
133 
134 
135 
136 
137 
138 


139 . 


140 
141 
142 
143 
144 
145 
146 
147 
148 


Ox5Sc 
OxSd 
0xSe 
OXSf 
0x60 
0x61 
0x62 
0x63 
0x64 
0x65 
0x66 
Ox67 
Ox68 
Ox69 


Ox6a 


Ox6b 


.0x6c 


Ox6d 
0x6e 
Ox6f 
0x70 
Ox71 
0x72 
Ox73 
Ox74 
Ox75 
Ox76 
Ox77 
0x78 
Ox79 
Ox7a 
Ox7b 
Ox7c 
0x7d 
Ox7e 
Ox7f 
0x80 
Ox81 
0x82 
Ox83 
Ox84 
Ox85 
Ox86 
Ox87 
Ox88 
Ox89 
Ox8a 
Ox8b 
Ox8c 
Ox8d 
Ox8e 
Ox8f 
0Ox90 
Ox91 
Ox92 
Ox93 
Ox94 


dup2 
dup2_x1 
dup2_x2 
swap 
iadd 
1add 
fadd 
dadd 
isub 
lsub 
fsub 
dsub 
imul 
]mu] 
fmul 
dmul 
idiv 
1div 
fdiv 
ddiv 
irem 
1rem 
frem 
drem 
ineg 
lneg 
fneg 
dneg 
ish] 
1shi 
ishr 
1shr 
iushr 
Tushr 
iand 
land 
ior 
lor 
ixor 
1xor 
iinc 
i21 
i2f 
i2d 
121 
12f 
12d 
f21 
f21 
f2d 
d2i 
d21 
d2f 
i2b 
i2c 
i2s 
1cmp 


149 
150 
151 
152 
153 
154 
155 
156 
157 
158 
159 
160 
161 
162 
163 
164 
165 
166 
167 
168 
169 
170 
171 
172 
173 
174 
175 
176 
177 
178 
179 
180 
181 
182 
183 
184 
185 
186 
187 
188 
189 
190 
191 
192 
193 
194 
195 
196 
197 
198 
199 
200 
201 
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Ox95 
0x96 
Ox97 
Ox98 
Ox99 
Ox9a 
Ox9b 


Ox9c . 


Ox9d 
Ox9e 
Ox9f 
0xa0 
Oxal 
Oxa2 
Oxa3 
Oxa4 
Oxa5 
Oxa6 
Oxa7 
Oxa8 
Oxa9 
Oxaa 
Oxab 
Oxac 
Oxad 
Oxae 
Oxaf 
Oxb0 
Oxbl 
Oxb2 
Oxb3 
Oxb4 
0Oxb5 
Oxb6 
Oxb7 
Oxb8 
Oxb9 
Oxba 
Oxbb 
Oxbc 
Oxbd 
Oxbe 
Oxbf 
0Oxc0 
Oxcl 
Oxc2 
Oxc3 
Oxc4 
Oxc5 
Oxc6 
Oxc7 
Oxc8 
Oxc9 


fcmp] 

fcmpg 

dcmp1 

dcmpg 

ifeq 

ifne 

if1t 

ifge 

ifgt 

ifle 

if_icmpea 

if_icmpne 

if-icmp1t 

1f_icmpge 

if_icmpgt 

if_icmple 

if_acmpeq 

if_-acmpne 

goto 

jsr 

ret 
tableswitch 
lookupswitch 
ireturn 
lreturn 
freturn 
dreturn 
areturn 
return 
getstatic 
putstatic 
getfield 
putfie1d 
invokevirtual 
invokespecial 
invokestatic 
invokeinterface 
XXxXunusedxxx 
new 
newarray 
anewarray 
arraylength 
athrow 
checkcast 
instanceof 
monitorenter 
monitorexit 
wide 
multianewarray 
1fnu11 


.ifnonnu]11 


goto_w 
jsrw 


227 
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CC 


C.2 保留 的 操作 代码 
JVM 标 准 还 保留 了 以 下 的 操作 代码 ; 


202 Oxca breakpoint 
254 Oxfe impdep1 
255 Oxff impdep2 


操作 代码 202 (breakpoint) 用 于 调试 ， 而 操作 代码 254 和 255 则 保留 用 于 JVM 本 身 的 内 部 
用 途 。 它 们 永远 不 应 该 出 现在 一 个 存储 的 类 文件 中 。 事 实 上 ， 带 有 这 些 操作 代码 的 类 文件 应 
该 不 能 通过 验证 。 


C.3 “快速 ”的 伪 操 作 代码 


在 1995 年 ，Sun 微 系统 公司 的 研究 人 员 提 出 采用 内 部 “快速 ”操作 代码 作为 提高 Java 编 译 
名 速度 和 效率 的 方法 。 通 常 ， 当 访问 常量 池 中 的 一 个 条 目 时 ， 该 条 目 必须 被 解析 以 确认 其 可 
得 到 和 类 型 兼容 。 如 果 一 条 语句 必须 执行 车 干 次 ， 这 个 解析 过 程 就 会 碱 慢 计 算 机 的 速度 。 作 
为 其 即时 《Just-In-Time, JIT) 编译 器 ，Sun 提 出 了 一 组 操作 代码 ， 这 些 操作 代码 假设 条 目 已 
经 被 解析 。 当 一 个 正常 的 操作 代码 被 成 功 地 执行 时 ， 其 在 内 部 可 用 一 个 “快速 ” 伪 操 作 代码 
替换 ， 以 跳 过 解析 步骤 ， 加 快 后 续 工 作 的 执行 速度 。 

这 些 伪 操作 代码 永远 不 应 出 现在 一 个 长 期 存储 的 类 文件 中 。 相 反 ，JVM 本 身 可 将 操作 代 
码 重 写 在 一 个 正在 执行 的 类 中 。 如 果 做 得 正确 ， 这 个 变化 对 于 Java 程 序 员 甚 至 编译 器 编写 者 
来 说 就 完全 是 不 可 见 的 。 所 提出 的 优化 伪 操作 代码 包括 ， 


203 0xcb 1dc-quick 

205 Oxcd ldc_w_quick 

206 Oxce getfield.quick 

207 Oxcf putfield_quick 

208 Oxd0 getfield2_quick 

209 Oxdl putfield2_quick 

210 0xd2 getstatic quick 

211 Oxd3 putstatic_quick 

212 Oxd4 getstatic2_quick 

213 Oxd5 putstatic2._quick 

214 Oxd6 invokevirtual_quick 
215 Oxd7 invokenonvirtual_quick 
216 OQxd8 invokesuper_quick 

217 Oxd9 invokestatic_quick 
218 Oxda invokeinterface_quick 
219 Oxdb invokevirtualobject_quick 
221 Oxdd new_quick 

222 0xde anewarray_quick 

223 Oxdf multianewarray.quick 
224 Oxe0 checkcast_quick 

225 Oxel instanceof_quick 

226 Oxe2 invokevirtual_quick_w 
227 Oxe3 getfield quick w 

228 Oxe4 putfield quick_w 


当然 ， 不 同 的 实现 者 也 完全 可 采用 不 同 的 优化 方法 或 一 组 不 同 的 快速 操作 代码 。 
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C.4 未 使 用 的 操作 代码 


操作 代码 186 由 于 历史 原因 未 被 使 用 ， 其 先前 的 用 法 在 目前 的 JVM 版 本 中 已 不 再 有 效 。 操 
作 代码 204、220 及 229-253 在 目前 的 JVM 规 范 中 未 予 分 配 ， 但 在 较 后 的 版 本 中 可 能 得 到 分 配 和 
使 用 。 


附录 D 类 文件 格式 


D.1 概述 和 基本 原理 


在 第 10 章 我们 曾 简要 地 提 到 过 ，JVM 的 类 文件 被 存储 成 一 组 九 套 的 表 。 这 实际 上 有 点 用 ， 
词 不 当 ， 因 为 在 类 被 存储 或 传送 时 都 使 用 相同 的 格式 ， 所 以 在 网 络 上 接收 到 的 类 都 是 相同 的 
格式 ， 成 为 “file.”。 每 个 “file” 包 含 了 类 所 需要 的 信息 ， 包 括 所 有 方法 的 字 节 码 、 类 内 部 
的 域 和 数据 ， 以 及 与 类 系统 的 其 余部 分 进行 交互 作用 的 属性 ， 包 括 名 字 和 继承 的 细节 。 

在 类 文件 中 的 所 有 数据 都 存储 成 8 位 字 节 或 者 16 位 、32 位 、64 位 这 样 多 个 字 节 的 组 。 这 在 
标准 文档 中 分 别 以 ul1、u2、u4、u8 来 引用 ， 但 是 ， 如 果 将 它们 仅仅 看 作 是 字 节 、 短 整数 、 整 
数 及 长 整数 或 许 会 更 容易 一 些 。 要 防止 采用 不 同 存储 惯例 的 机 器 之 间 出 现 混乱 (比如 8088 及 
其 字 节 交换 )， 字 节 被 定义 为 按 “ 网 络 顺 序 ”( 也 称 为 “大 端 字 节 序 ” 或 者 “最 高 有 效 字 节 
(MSB) 顺序 ") 到 来 ， 就 是 最 高 有 效 字 节 首先 到 来 。 例 如 ， 任 何 JVM 类 的 前 4 个 字 节 必须 是 所 
谓 的 魔幻 数 0xCAFEBABE (显然 是 一 个 整数 ) 。 这 个 数 被 存储 成 4 字 节 序列 的 顺序 是 : O0xCA、 
0xFE、0xBA、0xBE。 

类 文件 的 顶级 表 包 含 一 些 (固定 大 小 的 ) 内 务 管理 信息 ， 以 及 5 个 大 小 变化 的 低级 表 。 在 
不 同 组 件 之 间 没 有 填补 或 对 齐 ， 这 使 得 从 类 文件 中 取出 特定 部 分 有 些 困难 。 

类 文件 的 详细 顶级 格式 〈 表 D-1) 如 下 所 示 : 


表 D-1 类 文件 格式 的 详细 说 明 





大 小 标志 符 注释 

整数 魔幻 数 定义 的 值 是 0xCAFEBABE 

短 整数 次 版 本 定义 与 哪个 次 版 本 的 JVM 类 文件 相 容 
短 整数 主 版 本 定义 与 哪个 主 版 本 的 JVM 类 文件 相 容 
短 整 数 常量 池 数 量 在 接 下 来 的 表 中 的 最 大 条 目 数 

变量 常量 池 类 使 用 的 常量 池 

短 整 数 访问 标志 有 效 访问 类 型 (public、static、interface、 等 等 ) 
短 整 数 该 类 该 类 的 类 型 的 标志 符 

短 整数 超 类 该 类 的 超 类 类 型 的 标志 符 

短 整 数 接口 数量 在 接 下 来 的 表 中 的 条 目 数 

变量 接口 该 类 实现 的 接口 

短 整数 域 数量 在 接 下 来 的 表 中 的 条 目 数 

变量 域 作为 该 类 组 成 部 分 而 声明 的 域 

短 整 数 方法 数量 在 接 下 来 的 表 中 的 条 目 数 

变量 方法 作为 该 类 组 成 部 分 而 定义 的 方法 

短 整 数 属性 数量 在 接 下 来 的 表 中 的 条 目 数 

变量 属性 该 类 的 其 他 属性 


“魔幻 数 ” 已 经 描述 过 了 ， 其 作用 是 使 在 系统 中 快速 辨识 类 文件 更 容易 ， 此 外 并 无 实际 意 
图 。 主 版 本 和 次 版 本 号 有 助 于 跟踪 兼容 性 。 例 如 ， 一 个 非常 老 的 类 文件 〈 或 者 用 非常 老 的 
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Java 版 本 编译 的 类 文件 ) 可 能 使 用 已 不 存在 或 语义 已 改变 的 操作 代码 。 目 前 的 Java 版 本 (就 是 
2006 年 版 ) 使 用 了 次 版 本 号 0 和 主 版 本 号 46 (0x2e) ， 对 应 于 新 的 Java 5.0 版 。 

这 个 类 及 其 超 类 的 域 引用 常量 池 中 的 条 目 (细节 请 见 下 一 部 分 )， 并 定义 了 当前 类 的 名 字 
以 及 直接 的 超 类 。 最 后 ， 访 问 标志 域 定义 了 当前 类 的 与 访问 相关 的 性 质 ， 例 如 ， 如 果 这 个 类 
被 定义 成 abstract， 这 就 阻止 了 其 他 类 将 其 用 作为 new 指 令 的 参数 。 这 些 性 质 作 为 独立 的 标志 
存储 在 一 个 双 字 的 位 向 量 中 ， 如 下 所 示 : 


含义 位 值 解 ” 释 

public 0x0001 类 可 被 访问 

final 0x0010 类 不 能 有 子 类 
super 0x0020 新 的 调用 语义 
interface 0x-200 文件 实际 上 是 接口 
abstract 0x0400 类 不 能 被 实例 化 


这 样 ， 如 果 访 问 标 志 域 是 0x0601， 就 定义 了 “public”、“abstract”、“interface”。 
D.2 子 表 结构 


D.2.1 常量 池 

常量 池 被 构造 成 为 一 序列 的 独立 条 目 ， 表 示 程 序 所 使 用 的 常量 。 例 如 ， 一 个 表示 整数 值 
1010 的 常量 将 被 存储 在 5 个 连续 的 字 节 中 。 最 后 4 个 字 节 就 是 1010 的 二 进 制 表 示 (作为 整数 )， 
而 第 一 个 字 节 是 一 个 标志 值 ， 将 这 个 条 目 定义 为 一 个 整数 (因此 要 5 个 字 节 )。 根 据 标志 类 型 
的 不 同 ， 条 目的 大 小 和 内 部 格式 如 下 表 变 化 : 


类 型 
UTF8 串 
整数 
浮 点 数 
长 整数 
双 精 度数 
类 

串 

域 引用 
方法 引用 10 
接口 方法 引用 11 
名 字 和 类 型 12 


整数 、 长 整数 、 浮 点 数 以 及 双 精 度数 的 结构 是 不 言 自 明 的 。 例 如 ， 一 个 常量 池 的 整数 入 
口 包 含 5 个 字 节 ， 初 始 字 节 为 3 (将 该 条 目 定义 为 整数 ) ，4 个 字 节 就 是 整数 值 本 身 。UTF8 串 被 
存储 成 一 个 无 符号 的 长 度 值 (2 个 字 节 长 度 ， 人 允许 65536 个 字符 的 串 ) 和 一 个 包含 了 串 中 字符 
值 的 变 长 度 的 字 节 数组 。 在 Java 类 文件 中 的 所 有 文字 串 ， 包 括 串 常量 、 类 名 字 、 方 法 和 域 的 
名 字 等 等 ， 都 在 内 部 存储 成 UTF8 串 常量 。 

其 他 类 型 的 内 部 域 引用 了 常量 池 中 其 他 条 目的 索引 。 例 如 ， 一 个 域 引用 包含 5 个 字 节 。 第 
一 个 字 节 是 定义 了 一 个 域 的 标志 值 ( 值 为 9)。 第 二 个 和 第 三 个 字 节 保存 了 常量 池 中 另 一 个 条 
目的 索引 ， 定 义 了 该 域 属于 哪个 类 。 第 四 个 和 第 五 个 字 节 保存 了 一 个 “名 字 和 类 型 ”条 目的 
索引 ， 定 义 了 名 字 和 域 。 这 个 名 字 和 类 型 条 目 有 一 个 适当 的 标志 〈 值 为 12) ， 然 后 就 是 定义 了 
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名 字 / 类 型 的 两 个 UTF8 串 的 索引 。 

关于 常量 地 有 两 个 重要 的 警告 。 由 于 历史 原因 ， 常 量 池 条 目 号 0 从 未 被 使 用 过 ， 初 始 元 素 
的 索引 是 1。 由 于 这 个 原因 ， 与 Java 中 多 数 其 他 数组 类 型 元 素 (以 及 其 他 类 文件 条 目 ) 不 同 ， 
如 果 有 k 个 常量 地 条 目 ， 则 最 高 条 目 是 k 而 不 是 k-1。 还 因为 历史 原因 ， 类 型 为 长 整数 或 双 精度 
数 的 常量 地 条 目 被 当 作 两 个 条 目 看 待 。 如 果 常 量 池 条 目 6 是 一 个 长 整数 ， 则 下 一 个 池 条 目的 索 
引 就 应 该 是 8。 在 这 种 情况 下 ， 索 引 7 将 是 无 用 和 非法 的 。 


D.2.2 域 表 


”类 的 每 个 域 在 内 部 定义 为 一 个 具有 如 下 域 的 表 条 目 : 
一 -一 ~ 一 


大 小 标志 符 注释 

短 整数 访问 标志 该 域 的 访问 性 质 

短 整 数 名 字 在 常量 地 中 的 名 字 索 引 
短 整 数 描述 符 串 类 型 的 索引 

短 整 数 属性 数 域 属性 的 数量 

变量 属性 域 属性 数组 





名 字 和 类 型 域 只 不 过 分 别 是 常量 池 中 名 字 和 类 型 描述 符 串 的 索引 。 访 问 标志 域 是 标志 的 
位 向 量 ， 像 以 前 一 样 下面 的 表 给 出 了 解释 )， 为 域 定义 了 有 效 访问 属性 。 最 后 ， 属 性 表 定 义 
了 域 的 属性 ， 就 像 类 属性 表 定义 了 类 作为 整体 的 属性 。 








含义 位 值 解释 

Public Ox001 域 可 被 访问 

Private 0x0002 域 只 能 被 定义 类 所 访问 

Protected 0x0004 域 可 被 类 和 子 类 所 访问 

Static 0x0008 类 域 ， 非 实例 域 

Final 0x0010 域 不 能 被 改变 

volatile 0x0040 域 不 能 被 缓存 

transient Ox0080 域 不 能 被 对 象 管理 器 写 / 读 
D.2.3 方法 表 


类 中 定义 的 每 个 方法 都 在 内 部 描述 为 一 个 表 条 目 ， 其 格式 几乎 与 前 面 描述 的 域 的 条 目 相 
同 。 唯 一 的 差异 就 是 对 于 的 不 同 访问 标志 用 了 特定 的 值 来 表示 ， 如 下 表 所 示 : 


含义 位 值 解释 
public 0x0001 域 可 被 访问 
private 0x0002 域 只 能 被 定义 类 所 访问 
protected 0x0004 域 可 被 类 和 子 类 所 访问 
Static 0x0008 类 域 ， 非 实例 域 
Final 0x0010 域 不 能 被 改变 
synchronized 0x0020 调用 是 时 钟 同步 的 
native 0x0100 用 本 地 硬件 语言 实现 
abstract 0x0400 没有 已 定义 的 实现 
Strick 0x0800 严格 的 浮 点 语义 


D.2.4 属性 
类 文件 的 几乎 所 有 部 分 ， 包 括 顶 级 表 本 身 ， 都 包含 一 个 可 能 的 属性 (attribute) 子 表 。 这 
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个 子 表 包含 了 由 编译 器 所 生成 的 “属性 ” ， 用 以 描述 或 支持 计算 。 每 个 编译 器 都 允许 定义 特定 
的 属性 ， 而 JVM 的 实现 还 要 能 忽略 其 不 认识 的 属性 ， 所 以 这 个 附录 无 法 提供 一 个 可 能 属性 的 
完全 列表 。 另 一 方面 ， 某 些 属性 必须 存在 ， 如 果 JVM 所 要 求 的 某 个 属性 不 存在 ， 则 JVM 就 不 
能 正确 运行 。 


每 个 属性 被 存储 为 以 下 格式 的 表 : 
大 小 标志 竺 注 “ 矢 
短 整 数 属性 名 属性 的 名 字 
整数 属性 长 度 以 字 节 数 表示 的 属性 长 度 
变量 信息 属性 的 内 容 


可 能 最 显然 (并且 最 重要 ) 的 属性 就 是 Code 属 性 ， 它 作为 方法 的 一 个 属性 ， 包 含 了 特定 
方法 的 字 节 码 。Exceptions 属 性 定义 了 特定 方法 可 能 给 出 的 异常 类 型 。 为 支持 调试 器 ， 
Sourcefile 属 性 存储 了 创建 该 类 文件 的 源 文件 名 ，LineNumberTable 存 储 了 在 字 节 码 中 的 哪些 字 
节 与 源 代 码 中 的 哪些 行 相对 应 。 类 似 地 ，LocalVariableTable 属 性 定义 了 (在 源 文件 中 的 ) 哪 
个 变量 与 VM 中 的 哪个 局 部 变量 相对 应 。 用 -g 标 志 (在 *NIX 系 统 上 ) 进行 编译 〈 或 汇编 ) ， 就 
通常 会 导致 这 些 属性 被 放置 到 类 文件 。 如 果 没 有 这 个 -g， 这 些 属性 就 经 常 被 忽略 以 节省 空间 
和 时 间 。 


附录 E ASCII 表 





入 全 过 多 











28 ( ) - 2f / 
30 0 1 34 5 37 7 
38 8 9 ; ; 3c = 3f ? 
40 @ A B C 44 E 47 G 
48 H I 了 K 4c M 4 o 
50 Pp Q R S 54 U 57 W 
S8 X Y Zz [ Sc 】 sf - 
60 a b C 64 € 67 g 
68 h i j k tc m 6f o 
70 Pp q T S 74 u 77 w 
78 x y z { 7c } 7f del 





注意 : ASCIIOx2.0 (十 进 制 32) 是 一 个 空格 (“” 


E.2 历史 和 概述 


ASCII， 即 美国 标准 信息 交换 码 (American Standard Code for Information Interchange) 
几 十 年 来 一 直 是 以 二 进 制 格式 对 字符 数据 进行 编码 的 最 常用 标准 〈 它 在 1963 年 形成 ， 在 1968 
年 国际 化 )。 其 他 曾经 常用 的 格式 如 EBCDIC 和 Bauot 在 很 大 程度 上 已 经 成 为 历史 。 初 始 的 
ASCII 字 符 集 定义 了 一 个 7 位 的 标准 ， 用 于 对 128 个 不 同 的 字符 进行 编码 ， 包 括 (美国 英语 中 ) 
全 部 大 写 和 小 写字 母 的 集合 ， 以 及 很 多 符号 和 标点 符号 。 此 外 ， 在 ASCII 表 中 前 32 个 项 定义 了 
大 多 数 的 不 可 打印 的 控制 字符 (control characters) ， 如 退 格 (backspace，0x08) 、[ 水 平 ] 制 表 
符 (horizontal tab ，0x09) 、[ 垂 直 ] 制 表 符 (vertical tab，0x10) ， 甚 至 一 个 有 声 的 “铃声 
(bell) ”( 现 在 通常 是 一 次 响 铃 beep，0x07) 。 遗 憾 的 是 ，ASCII 对 非 英语 的 语言 支持 得 不 好 ， 
其 至 对 很 多 常见 的 有 用 符号 如 一 、 志 以 及 英镑 符号 (# ) 也 不 支持 。 

由 于 几乎 所 有 的 计算 机 都 是 存储 8 位 字 节 ， 所 以 字 节 0x80...0xFF 这 些 没有 被 解释 成 标准 字 
符 的 字 节 值 就 常常 用 于 对 ASCII 表 进行 机 器 无 关 的 专 有 扩展 。 例 如 ， 字 母 O 用 于 德 文中 而 不 用 
于 英文 中 。 微 软 已 经 定义 了 一 个 扩展 的 ASCII 表 (此 外 还 有 由 多 种 基于 Windows 程 序 所 使 用 的 
若干 个 不 同 集合 ) ， 该 表 用 项 0x94 来 表示 这 个 值 ， 作 为 一 个 相当 完整 的 德 文 专用 字符 集 的 组 成 
部 分 。 这 个 表 还 将 项 0xE2 定 义 成 大 写 的 T， 但 奇怪 的 是 却 没 有 为 小 写 的 7 定义 一 个 项 。 我 猜测 ， 
对 于 字符 集 的 设计 者 来 说 ， 说 德语 的 市 场 要 比 说 希腊 语 的 市 场 更 重要 。 对 比 起 来 ， 苹 果 对 于 
扩展 的 字符 没有 定义 意思 (至 少 对 于 其 在 OS X 环 境 下 的 “终端 ”环境 ) 。 

问题 的 核心 是 ， 只 有 256 种 不 同 存储 模式 的 单个 字 节 不 能 存储 足够 多 的 不 同 字符 。Java 的 
解决 方案 是 采用 一 个 更 大 的 字符 集 (Unicode) 并 将 它们 存储 成 2 字 节 的 量 。 


— 


字符 。 


词汇 表 


80x86 family (80x86 系 列 ) ” Intel 制造 的 一 个 系列 芯片 ， 从 Intel 4004 开 始 ， 并 历经 8008、 
8088、80086、80286、80386、80486， 以 及 各 种 奔腾 芯片 。 这 些 芯 片 构成 了 IBM-PC 的 基 
础 ， 其 后 继 就 是 当今 最 常用 的 芯片 体系 结构 。 

absolute address (绝对 地 址 ) 在 基于 8086 的 计算 机 中 ， 通 过 对 段 : 偏 移 存储 地 址 进行 组 合 而 
获得 的 20 位 地 址 。 

abstract (抽象 ) 一 个 不 包含 直接 的 实例 而 只 有 子 类 的 类 。 或 者 是 一 个 必须 在 子 类 中 实现 的 
未 实现 的 方法 。 

accumulator (累加 器 ) ”一 个 为 进行 高 速算 术 运算 ， 特 别 是 加 和 乘 而 指定 的 单个 寄存 器 。 在 
80x86 计 算 机 中 就 是 [E]AX 寄 存 器 。 

actual parameter (实际 参数 ) ”在 对 函数 或 方法 进行 调用 时 ， 用 于 圭 代 形 式 参 数 的 实际 值 。 

address (地 址 ) 在 存储 器 中 的 一 个 位 置 ， 或 者 说 是 用 于 指定 存储 器 中 某 位 置 的 数 。 

addressing mode ( 寻 址 模式 ) ”解释 位 模式 的 方式 ， 用 来 为 语句 定义 实际 的 操作 数 。 例 如 ， 
位 模式 0x0001 可 指定 实际 常数 1、 第 1 个 寄存 器 、 存 储 器 位 置 1 的 内 容 ， 等 等 。 参 见 各 个 模 
式 : immediate mode (立即 模式 ) 、register mode (寄存 器 模式 ) 、direct mode (直接 模式 )、 
indirect mode (间接 模式 )、index mode ( 变 址 模式 )。 

algorithm (算法 ) ”一 个 按 步 进行 的 、 意 义 明 确 的 过 程 。 用 于 达到 期 望 的 目标 或 执行 一 个 计 
算 。 

ALU 典型 计算 机 体系 结构 中 的 一 个 部 件 ， 在 其 中 要 执行 算术 和 逻辑 操作 。 是 CPU 的 一 部 分 。 

American Standard Code for Information interchange (美国 信息 交换 标准 码 ) ”参见 
ASCII。 

AND (与 (AND)) 一 个 布尔 函数 ， 当 且 仅 当 所 有 参数 都 是 真 时 返回 真 ， 否 则 就 返回 假 。 一 
个 与 门 是 一 个 硬件 电路 ， 它 对 输入 电信 号 实现 了 与 函数 。 

applet (应 用 程序 (applet)) 一 个 小 的 、 可 移植 的 程序 ， 典 型 地 是 作为 Web 页 的 一 部 分 。 

Arithmetic and Logical Unit (算术 和 逻辑 单元 ) 见 ALU。 

arithmetic shift (算术 移 位 ) ”一 个 移 位 操作 ， 其 中 最 左 端 〈 最 右 端 ) 位 被 复制 以 填充 空 出 的 
位 置 。 

array (数组 ) 一 个 派生 的 类 型 。 是 由 一 个 整数 索引 的 一 组 相同 类 型 的 子 元 素 。 

ASCII (ASCII) ”用 二 进 制 格式 表示 字符 数据 的 一 种 标准 方式 。ASCII 集 为 字母 、 数 字 以 及 一 
些 常用 标点 符号 定义 了 7 位 的 模式 。 

assembler (汇编 器 ) 一 个 将 用 汇编 语言 写成 的 原文 件 转换 成 可 执行 文件 的 程序 。 

assembly language (汇编 语言 ) ”一 种 低级 语言 ， 其 中 每 条 人 可 读 的 语句 精确 地 对 应 一 条 机 
器 指令 。 不 同 的 计算 机 类 型 有 不 同 的 汇编 语言 。 

attributes (属性 ) JVM 类 文件 格式 的 一 种 数据 结构 ， 用 于 存储 多 方面 的 信息 。 

backward compatibility (向 后 兼容 ) ”计算 机 或 者 系统 复制 以 前 机 型 的 操作 的 能 力 。 例 如 ， 
奔腾 对 于 8088 是 向 后 兼容 的 ， 所 以 对 于 为 最 初 JBM-PC 写 的 程序 它 也 能 运行 。 
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base ( 基 ) ”1. (基数 ) 用 数 制 中 数字 的 位 置 表示 的 数值 。 例如 ， 二 进 制 的 基数 是 2， 十 进 制 
的 基数 是 10， 而 十 六 进 制 的 基数 是 16。2. ( 基 极 ) 在 晶体 管 中 的 一 个 电 连 接 ， 用 于 控制 
从 发 射 极 到 集 电极 的 电流 。 

BAT (BAT) 将 存储 管理 器 内 部 的 逻辑 地 址 转换 到 固定 物理 存储 块 的 方法 。 

BCD (BCD) 在 80x86 系 列 的 数字 处 理 器 中 所 采用 的 一 种 方法 。 在 这 种 方法 中 ， 一 个 数 
的 每 个 十 进 制 数字 被 写成 相应 的 4 位 二 进 制 模式 。 例如 ， 数 4096 写 成 BCD 数 就 是 
0100 0000 1001 0110。 

big-endian (大 端 字 节 序 ) 一 种 存储 格式 ， 其 中 最 高 有 效 位 存储 成 字 的 第 一 个 和 最 高 序 的 位 。 
依照 大 端 字 节 序 格式 ， 数 32770 将 被 存储 成 二 进 制 10000010。 

binary (Binary (二 进 制 /二 元 )) 1. 一 种 计数 制 ， 其 中 所 有 数字 都 是 1 或 者 0， 并 且 连 续 数字 
的 权 值 是 2 倍 的 关系 。 数 31 写 成 二 进 制 数 就 是 11111。2. 只 接受 两 个 操作 数 的 数学 操作 符 ， 
如 加 法 。 

Binary Coded Decimal (二 进 制 编码 的 十 进 制 数 ) 见 BCD， | 

bit (位 ) 一 个 二 进 制 数 字 ， 是 计算 机 内 信息 的 基本 单位 。 一 个 位 可 有 两 种 取 值 ，0 或 者 1。 

bitwise ( 按 位 ) 一 种 布尔 操作 。 在 像 字 节 和 整数 的 多 位 结构 中 ， 这 种 操作 是 分 别 对 每 个 位 独 
立地 进行 的 。 

block address transiation (模块 地 址 转换 )” 见 BAT。 

boolean logic (布尔 逻辑 )” 依 乔治 . 布尔 命名 的 一 种 逻辑 系统 ， 其 中 的 操作 定义 成 二 进 制 量 
上 的 函数 并 按 此 执行 。 

branch (转移 ) ”一 种 机 器 指令 ， 这 种 指令 改变 程序 计数 器 (PC) 的 值 因 而 导致 计算 机 在 一 
个 不 同 的 存储 位 置 开始 执行 。 一 个 等 价 的 术语 是 goto。 

branch prediction (转移 (分支 ) 预测 ) 一 种 优化 技术 ， 这 种 技术 通过 预测 条 件 转移 指令 是 
否 发 生 转 移 来 加 速 计算 机 的 运行 速度 。 

bus (总 线 ) 典型 机 器 体系 结构 的 一 个 组 件 ， 承担 CPU、 存 储 器 以 及 外 设 之 间 的 连接 任务 ， 

busy-waiting (总 线 等 待 ) 通过 检测 事件 是 否 在 循环 内 部 已 经 发 生来 等 待 期 望 的 事件 。 与 中 
断 比 较 。 

byte 〈 字 节 ) 8 个 位 的 集合 。 用 作为 一 个 存储 单位 ， 以 表示 存储 器 大 小 或 者 寄存 器 容量 。 

bytecode ( 字 节 码 ) JVM 的 机 器 语言 。 

cache memory (高 速 缓冲 存储 器 ) ”一 块 高 速 存储 器 ， 用 于 存储 经 常 访问 的 项 以 提高 存储 器 
的 总 体 性 能 。 

Central Processing Unit (中 央 处 理 单元 ) ” 见 CPU，。 

CF “进位 标志 ， 当 最 近 的 操作 生成 一 个 向 寄存 器 外 的 进位 时 (比如 两 个 数 相 加 得 到 的 和 过 大 
时 )， 就 将 其 置 位 。 

CISC 一 种 计算 机 设计 观点 ， 即使 用 很 多 复杂 的 专用 指令 。 与 RISC 相 对 。 

class (类 ) 一 组 域 和 方法 ， 定义 了 面向 对 象 编程 环境 中 的 对 人 象 类 型 。 

class files (类 文件 ) ”JVM 采 用 的 一 种 格式 ， 用 于 将 类 (包括 记录 和 接口 ) 存储 到 长 期 存储 

class method (类 方法 ) ”由 面向 对 象 系 统 所 定义 的 方法 ， 是 作为 类 的 特性 而 不 是 该 类 的 任何 
实例 的 特性 。 

class variable (类 变量 ) ”由 面向 对 象 系 统 所 定义 的 变量 ， 是 作为 类 的 特性 而 不 是 该 类 的 任 
何 实例 的 特性 。 
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clock signal (时 钟 信号 ) ”计算 机 用 来 对 事件 进行 同步 和 度量 时 间 推 移 的 电信 号 。 

CLR ”微软 的 .NET 框 架 的 虚拟 机 。 

code (代码 ) ”可 执行 的 机 器 指令 ， 与 数据 相对 。 

collector ( 集 电极 ) ”标准 晶体 管 的 一 部 分 ， 除 非 基 极 电 流 关闭 ， 将 会 有 从 发 射 极 到 集 电极 的 
电流 。 

comment (注释 ) ”编程 语言 中 的 语句 ， 虽 然 被 计算 机 所 忽略 ， 但 却 可 能 包含 了 可 读 的 有 用 信 
息 。 在 jasmin 中 ， 注 释 开 始 于 分 号 (;)， 直 至 行 尾 。 

Common Language Runtime (通用 语言 运行 时 )” 见 CLR。 

compiler (编译 器 ) 一 种 程序 ， 用 于 将 用 高 级 语言 写 的 源 文 件 转 换 成 可 执行 文件 。 

complete/writeback (完成 / 写 回 ) ”流水 线 体系 结构 中 的 一 个 典型 阶段 ， 在 这 个 阶段 将 操作 的 
结果 存储 于 目标 位 置 。 

Complex Instruction Set Computing (复杂 指令 集 计算 )” 见 CISC。 

conditional branch (条 件 转 移 ) 一 种 转移 (如 ifle) ， 根 据 当 前 机 器 状态 决定 是 否 转移 。 

constant pool (常量 池 ) ”特定 JVM 类 使 用 的 一 组 常量 ， 存 储 在 类 文件 中 。 

control characters (控制 字符 ) “ 值 低 于 0x20 的 ASCII 字 符 ， 表 示 非 打印 字符 ， 如 回 车 或 响 
铃 。 

Control Unit (控制 单元 ) ”CPU 的 组 成 部 分 ， 其 功能 是 将 数据 移 人 和 移出 CPU 和 确定 执行 哪 
条 指令 。 

CPU 计算 机 的 心脏 ， 在 其 中 发 生计 算 ， 程序 被 执行 。 通 常 由 控制 单元 和 ALU 组 成 。 

data memory (数据 存储 器 ) ”用 于 存储 程序 数据 (如 变量 ) 而 不 是 程序 代码 的 存储 器 。 

decimal (十 进 制 ) 基数 为 10。 写 数字 的 通常 方式 。 

derived type (派生 类 型 ) ”通过 将 基本 类 型 相 结合 而 建立 起 来 的 数据 表示 类 型 。 例 如 ， 一 个 
分 数 类 型 可 由 分 子 和 分 母 两 个 整数 派生 而 成 。 

destination (目标 ) “数据 的 去 处 。 例 如 ， 在 指令 istore_3 中 ， 目 标 是 局 部 变量 妈 。 

destination index (目标 变 址 ) “在 80x86 系 列 中 的 一 个 寄存 器 ， 用 于 控制 串 原始 操作 的 目的 
地 。 

destination operand (目标 操作 数 ) ”定义 了 指令 目标 的 操作 数 。 在 奔腾 指令 集中 ， 如 在 
MOV AX, BX 中 ， 目 标 操作 数 通 常 为 第 一 个 操作 数 。 

device (设备 ) 外 设 的 另 一 个 名 字 。 . 

device driver (设备 驱动 器 ) 一 个 程序 〈 或 者 操作 系统 的 组 成 部 分 ， 用 于 控制 设备 ) 。 

diode (二 极 管 ) 一 种 电气 部 件 ， 只 能 允许 电 从 一 个 方向 通过 。 是 晶体 管 结构 的 组 成 部 分 。 

Direct Memory Access (直接 存储 器 访问 ) ”计算 机 拥有 的 一 种 能 力 ， 即 让 数据 在 主 存储 器 
与 外 设 (如 图 形 卡 ) 之 间 移 动 而 无 需 通 过 CPU 。 

direct mode (直接 模式 ) ”一 种 寻 址 模式 ， 共 中 的 位 模式 被 解释 为 保存 了 所 需 操 作 数 的 存储 
位 置 。 在 直接 模式 中 ， 位 模式 0x0001 被 解释 为 存储 位 置 1。 

directive (汇编 指令 ) “汇编 语言 中 的 语句 ， 在 jasmin 中 ， 以 句号 〈.) 开头 ， 这 种 语句 不 转换 
成 机 器 指令 但 给 汇编 器 指示 。.limit 就 是 汇编 指令 的 例子 。 

dirspatch (分 派 ) ”流水线 体 系 结构 的 一 个 典型 状态 ， 此 阶段 要 做 的 是 : 计算 机 分 析 指 令 以 确 
定 是 什么 类 型 的 指令 ， 从 适当 的 位 置 获得 源 参 数 ， 并 为 实际 执行 准备 指令 。 

dopants ( 挫 杂 物 ) ”有 意 加 入 到 半导体 (如 硅 ) 中 的 杂质 ， 以 影响 其 电 特性 。 引 入 这 些 杂质 
就 能 构造 出 二 极 管 和 晶体 管 ， 这 些 都 是 像 计 算 机 这 种 电子 设备 的 关键 部 件 。 | 
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DRAM (DRAM) 一 种 RAM， 需要 不 断 地 刷新 以 保持 数据 。 比 SRAM 慢 但 便宜 。 与 所 有 的 
RAM 一 样 ， 如 果 电 源 关闭 ， 则 存储 器 丢失 其 数据 。 

dst 目标 (destination) 的 缩写 。 

Dynamic RAM (动态 RAM) 见 DRAM。 

EEPROM 一 种 混合 存储 器 ， 结合 了 RAM 的 现场 可 编程 性 和 ROM 的 数据 持久 性 ， 

Electronically Erasable Programmable ROM ( 电 可 擦 除 可 编程 ROM) 见 EEPROM 。 

embedded system (个 入 式 系 统 ) ”一 种 计算 机 系统 ， 其 中 的 计算 机 是 更 大 环境 的 组 成 部 分 
而 不 是 独立 可 使 用 的 工具 。 一 个 例子 是 运行 DVD 播放 器 的 计算 机 。 

emitter (发 射 极 ) ”标准 晶体 管 的 组 成 部 分 ， 除 非 基 极 电流 关闭 ， 将 会 有 从 发 射 极 到 集 电 极 的 
电流 。 

EPROM 一 种 PROM， 一 般 可 通过 暴露 于 高 能 紫外 光 中 几 秒 钟 来 擦 除 其 内 容 。 这 些 存储 器 是 
可 重 编程 的 ， 但 不 是 现场 可 重 编程 。 

Erasable Programmable ROM (可 擦 除 可 编程 ROM) 见 EPROM 

execute (执行 ) 1. 运行 一 个 程序 或 机 器 指令 。2. 在 流水 线 体系 结构 中 的 一 个 典型 状态 ， 在 
此 阶段 计算 机 运行 一 条 以 前 取出 (并 分 派 ) 的 指令 。 

exponent (指数 ) ”在 IEEE 浮 点 表示 中 的 一 个 域 ， 用 于 控制 2 的 寡 ， 该 客 要 乘 以 尾数 。 

extended AX register (扩展 AX 寄 存 器 ) ”在 80386 或 80x86 系 列 较 后 来 的 芯片 (包括 奔腾 ) 
上 的 32 位 累加 器 。 

fetch ( 取 指 ) 1. 装 入 一 条 机 器 指令 以 准备 执行 。2. 流水 线 体系 结构 的 一 个 典型 状态 ， 在 此 
阶段 计算 机 从 主 存储 器 装 人 一 条 指令 。 

fetch-execure cycle ( 取 指 一 执行 周期 ) ”是 指 这 样 的 过 程 ， 计算 机 通过 取 指 得 到 要 执行 的 指 
令 ， 执 行 该 指令 ， 然 后 再 取 序 列 中 的 下 一 条 指令 ， 直 到 程序 结束 。 

Fibonacci sequence ( 斐 波 那 契 序 列 ) ”序列 1,1.2.3,， 其 中 每 一 项 是 前 面 紧邻 两 项 之 和 。 

fields ( 域 ) 在 记录 或 类 中 命名 的 数据 存储 位 置 。 

flags 〈 标 志 ) 用 于 存储 数据 的 二 进 制 变量 。 参 见 flag register (标志 寄存 器 ) 

flags register (标志 寄存 器 ) ”在 CPU 中 的 一 个 特殊 寄存 器 ， 保 存 了 一 组 与 当前 计算 状态 相关 
的 二 进 制 标 志 。 例 如 ， 如 果 在 算术 计算 中 机 器 发 生 溢出 ， 一 个 标志 (一般 称 为 “溢出 标 
志 ” 即 OF) 将 被 置 为 1。 一 个 后 来 的 条 件 转移 指令 可 检查 这 个 标志 。 

Flash (闪存 存储 器 ) 一 种 混合 存储 器 ， 将 RAM 的 现场 可 编程 性 与 ROM 的 数据 持久 性 相 结 合 。 
通常 用 于 笔 型 U 盘 和 数字 相机 中 。 

floating point ( 浮 点 ) 1. 计算 机 中 存储 的 任何 非 整 数值 。2. 一 种 特定 的 格式 ， 用 于 存储 二 进 
制 科 学 表示 法 的 非 整数 值 。 值 被 存储 成 尾数 与 2 的 指数 寡 的 乘积 。 

Foating Point Unit ( 浮 点 单元 )” 见 FPU。 

FPU (FPU) ”配属 于 CPU 的 专用 硬件 ， 用 以 处 理 浮 点 (不 是 整数 ) 计算 。 现 在 有 点 罕见 了 ， 
因为 多 数 CPU 能 在 自身 处 理 浮 点 操作 。 

foraml parameter (形式 参数 ) ”用 在 函数 或 方法 定义 中 的 变量 ， 用 于 作为 以 后 实际 参数 的 占 
位 符 。 

garbage collection (垃圾 收集 ) ”回收 不 再 使 用 的 存储 位 置 。 在 JVM 中 是 自动 进行 的 。 

gates ( 门 ) 实现 了 布尔 函数 的 电路 。 
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goto 参见 branch (转移 ) 。 

Harvard architecture (哈佛 体系 结构 ) ”一 种 非 汉 . 诺 依 曼 体系 结构 ， 其 中 的 代码 存 久 (用 
于 程序 ) 与 数据 存储 (用 于 变量 ) 是 分 开 的 。 

hexadecimal (十 六 进 制 ) ” 基 为 16。 一 种 数 制 ， 其 中 所 有 数字 都 是 0-9 或 字母 A-F， 并 且 连 续 
的 数字 之 间 是 16 倍 的 关系 。 十 六 进 制 数 33 可 写成 0x31。 

high (高 ) 1 .寄存 器 或 数据 值 的 高 位 部 分 。 特 别 是 ， 在 8088 上 的 通用 寄存 器 的 最 高 有 效 字 节 。 
2. 见 high-level( 高 级 )。 

high-level (高 级 ) ” 指 Java、C++、 或 Pascal 这 样 的 高 级 语言 ， 其 中 的 一 条 语 旬 可 能 对 应 于 若 
干 条 机 器 语言 指令 。 

hybrid memory (混合 存储 器 ) ”一 种 存储 器 ， 其 设计 将 RAM 的 现场 可 重 写 性 和 ROM 的 数据 
持久 性 结合 起 来 。 例 如 ， 见 EEPROM 或 Flash。 

immediate mode (立即 模式 ) ”一 种 寻 址 模式 ， 其 中 的 位 模式 被 解释 为 常数 操作 数 。 在 立即 
模式 中 ， 位 模式 0x001 就 是 常数 1。 

implement (实现 ) ”接口 的 实现 就 是 遵循 接口 而 不 是 接口 的 一 个 实例 。 

index mode ( 变 址 模式 ) “一 种 寻 址 模式 ， 其 中 一 个 位 模式 被 解释 为 针对 一 个 存储 地 址 的 偏 
移 ， 该 存储 地 址 存在 一 个 寄存 器 中 。 

indirect address register (间接 寻 址 寄存 器 ) ”一 个 用 于 间接 或 变 址 模式 的 寄存 器 ， 如 奔腾 的 
BX 或 Atmel 的 Y 寄 存 器 。 

indirect mode (间接 模式 ) 一 种 寻 址 模式 ， 其 中 的 一 个 位 模式 被 解释 为 保存 了 指向 实际 操作 
数 指针 的 存储 位 置 。 在 间接 模式 中 ， 位 模式 0x0001 将 被 解释 为 存储 在 存储 位 置 1 的 值 。 

infix (中 组 ) ”一 种 写 表达 式 的 方法 ， 其 中 的 二 元 操作 符 位 于 其 参数 之 间 ， 如 3 二 4。 请 比较 后 
绥 和 前 缀 。 

initialize (初始 化 ) ”在 使 用 前 设置 一 个 特定 的 初始 值 ， 或 者 调用 一 个 函数 来 执行 这 个 任务 。 

instance method (实例 方法 ) ”一 个 方法 ， 由 面向 对 象 系统 作为 一 个 性 质 定 义 ， 而 不 是 由 其 
控制 类 所 定义 。 

instance variable (实例 变量 ) ”一 个 变量 ， 由 面向 对 象 系统 作为 一 个 性 质 定义 ,而 不 是 由 其 
控制 类 所 定义 。 

instruction (指令 ) “一般 来 说 是 对 计算 机 的 一 个 命令 。 在 机 器 代码 中 ， 就 是 表示 单个 操作 的 
位 模式 。 在 汇编 语言 中 ， 就 是 一 种 能 直接 转换 成 机 器 指令 的 语句 。 

instruction pointer (指令 指针 ) 见 IP。 

instruction queue (指令 队列 ) ”一 组 有 序 的 指令 ， 等 待 被 装 入 ， 或 者 已 经 被 装 入 并 等 待 被 执 
行 。 

instruction register (指令 寄存 器 (IR)) CPU 内 的 寄存 器 ， 保 存 当 前 指令 以 待 分 派 和 执行 

instruction set (指令 集 ) 某 特 定 CPU 能 执行 的 一 组 操作 。 

integrated circuit (集成 电路 ) ”一 个 制造 在 单个 硅 芯 片上 的 电路 而 不 是 很 多 分 立 元 件 。 

interface (接口 ) ”一 个 抽象 的 类 ， 定 义 了 不 同 对 象 共享 的 行为 ， 但 在 正常 的 继承 结构 之 外 。 

interrupt 〈 中 断 ) “1. 一 小 段 预 先 建立 的 代码 ， 当 特定 事件 发 生 时 执行 。2. 对 CPU 的 通知 ， 告 
诉 CPU 事 件 已 经 发 生 ， 这 一 段 代码 应 该 执行 了 。 

interrupt handler (中 断 处 理 程序 ) ”一 个 用 于 处 理 期 望 事件 而 无 需 忙碌 -等 待 开销 的 系统 。 

invoke 〈 调 用 ) 执行 一 个 方法 。 
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MO controller (IO 控制 器 ) 典型 机 器 体系 结构 的 一 个 部 件 ， 用 于 控制 一 个 特定 的 外 设 进行 
输入 和 输出 。 IO 控制 器 通常 接受 和 解释 来 自 总 线 的 信息 ， 并 照顾 在 操作 特定 部 件 如 硬 驱 
时 的 细节 。 

I/O registers (LO 寄存 器 ) “用 于 发 送信 号 到 一 个 IO 控制 器 的 寄存 器 ， 尤其 是 在 Atmel AVR 
上 。 

IP。 即 指令 指针 ， 是 一 个 标准 的 CPU 寄存 器 ， 保存 了 正在 执行 的 当前 指令 的 位 置 。 

jasmin (jasmin) 由 Meyer 和 Downing 为 JVM 写 的 汇编 器 ， 本 书 的 主要 教学 语言 。 

Java Virtual Machine (Java 虚 拟 机 ) 见 JVM。 

JIT compilation (JIT 编 译 ) ”一 种 加 速 JVM 程 序 执行 的 技术 ， 是 通过 将 每 条 语句 转换 成 等 价 
的 本 地 机 器 语言 指令 实现 的 。 

Just In Time ( 即 ) 见 JIT 编 译 。 

JVM 一 个 作为 Java 编 程 语言 基础 的 虚拟 机 ， 本 书 的 主要 教学 机 器 。 

label (标号 ) 在 汇编 语言 中 ， 是 针对 特定 代码 行 的 可 读 标记 ， 使 得 该 行 可 作为 转移 指令 的 目 
标 。 

latency (等 待 时 间 ) ”完成 某 事 所 需要 的 时 间 。 在 一 个 指令 等 待 时 间 为 1xs 的 计算 机 上 ， 执 行 
一 条 指令 至 少 需 要 这 些 时 间 。 

linear congruential generator (线性 同 余数 生成 器 ) 一 个 通用 的 伪 随 机 数 生 成 器 ， 生成 器 连 
续 返 回 的 是 形 为 newvalue=(a . oldvalue+c)%m 的 等 式 的 值 。 

link (链接 ) ”将 存储 于 磁盘 上 的 一 组 字 节 码 (或 机 器 指令 ) 转换 成 可 执行 格式 的 过 程 。 

little-endian (小 端 字 节 序 ) ”一 种 存储 格式 ， 其 中 最 低 有 效 位 被 存储 在 一 个 字 的 第 一 个 和 最 
高 序 的 位 。 在 小 端 字 节 序 格式 中 ， 数 32770 被 存储 为 二 进 制 数 01000001。 

llasm (llasm) 与 微软 的 .NET 框 架 一 起 使 用 的 汇编 器 。 

load (〈 装 和 人 ) 将 一 组 字 节 码 (或 机 器 指令 ) 从 磁盘 转移 到 存储 器 的 过 程 。 

logical address (逻辑 地 址 ) ”存储 在 寄存 器 中 的 位 模式 ， 用 于 在 由 任何 存储 管理 或 虚拟 存储 
例 程 解释 之 前 访问 存储 器 。 

logical memory (逻辑 存储 器 ) ”由 一 组 逻辑 地 址 定义 的 地 址 空间 ， 与 由 存储 管理 器 存储 数据 
的 物理 存储 器 相 区 别 。 

logical shift 《逻辑 移 位 ) ”一 种 移 位 操作 ， 其 中 新 空 出 的 位 置 用 0 值 来 填充 。 与 算术 移 位 相 比 
较 。 

long (长 整数 ) 在 Java 或 jasmin 中 ， 一 种 64 位 (两 个 字 ) 整数 类 型 的 数据 存储 格式 。 

low-level (低级 ) 一 种 像 jasmin 或 其 他 汇编 语言 的 语言 ， 其 中 单个 语句 对 应 于 单个 机 器 语言 
指令 。 

machine code (机 器 码 ) 见 机 器 语言 。 

machine cycle (机 器 周期 ) ”计算 机 的 一 个 基本 时 间 单 位 ， 典型 地 定义 为 执行 单条 指令 所 需 
时 间 ， 或 者 也 可 以 定义 为 系统 时 钟 的 时 间 单 位 。 

machine language (机 器 语言 ) ”计算 机 程序 的 基本 指令 的 二 进 制 编码 。 机 器 语言 一 般 不 是 
由 人 写 的 ， 而 是 由 其 他 程序 如 编译 器 或 汇编 器 生成 的 。 

machine state register (机 器 状态 寄存 器 ) 一 个 将 计算 机 的 总 体 状 态 描述 为 一 组 标志 的 寄存 
器 。 

mantissa (尾数 ) 一 个 浮 点 数 的 分 数 部 分 ， 即将 要 用 一 个 包含 2 的 某 次 等 的 比例 因子 相 乘 。 

math coprococessor (数学 协 处 理 器 ) ”一 个 辅助 芯片 ， 通 常用 于 浮 点 计算 ， 而 ALU 处 理 的 
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是 整数 计算 。 

memory-manager (存储 管理 器 ) ”一 个 用 于 控制 程序 访问 物理 存储 器 的 系统 。 它 通常 能 提高 
性 能 、 增 加 安全 性 、 并 增 大 程序 能 使 用 的 存储 量 。 

memory-maped 1/O (存储 器 -映射 的 VO) ”一 种 执行 1/O 的 方法 ， 其 中 1/O 控 制 器 自动 读 特定 
的 存储 位 置 而 不 使 用 总 线 。 

microcontroller ( 微 控 制 器 ) ”一 种 小 的 计算 机 ， 通 常 是 岁入 式 系统 的 组 成 部 分 ， 而 不 是 独立 
可 编程 的 计算 机 的 组 成 部 分 。 

microprogramming ( 微 程序 设计 ) ”将 计算 机 的 (复杂 ) 指令 集 实现 为 一 序列 较 小 的 类 RISC 
的 指令 。 

Microsoft Intermediate Language (微软 中 间 语 言 ) 见 MSIL。 

MIMD 计算 机 在 两 个 不 同 部 分 同时 执行 两 个 不 同 指令 的 能 力 。 

MMX instructions (MMX 指令 ) 在 80x86 系 列 世 片 的 较 后 的 模型 上 实现 SIMD 并 行 性 的 指令 。 

mnemonic ( 助 记 符 ) 一 种 可 读 的 汇编 语言 程序 的 一 部 分 ， 对 应 于 特定 的 操作 或 操作 代码 。 

mode (模式 )” 见 addressing mode ( 寻 址 模式 )。 

modulus ( 模 数 ) “余数 ”的 形式 化 数学 定义 。 

monitor (监视 器 ) ”JVM 的 一 个 子 系 统 ， 用 于 确保 在 同一 时 间 只 有 一 个 方法 /线程 能 访问 一 块 
数据 。 

Monte Carlo simulation (蒙特 卡 洛 模拟 ) ”一 种 通过 重复 使 用 随机 数 来 探索 大 规模 解 空 间 的 
技术 。 

most significant (最 高 有 效 ) “对 应 于 基数 的 最 高 寡 的 数字 或 字 节 。 例 如 ， 对 于 数 361402，， 
数字 3 就 是 最 高 有 效 数 字 。 还 请 见 大 端 字 节 序 、 小 端 字 节 序 。 

motherboard ( 母 板 ) ”计算 机 板 ，CPU 和 多 数 至 关 重要 的 其 他 部 件 都 置 于 其 上 。 

MSIL ”对 应 于 JVM 字 节 码 的 语言 ， 是 微软 .NET 框 架 的 基础 。 

MSR 见 机 器 状态 寄存 器 。 

nonvolatile memory ( 非 易 失 存储 器 ) ”即使 是 在 掉 电 后 所 存储 的 数据 仍 存在 的 存储 器 。 

Non-Volatile RAM ( 韭 易 失 RAM) 见 NVRAM。 

normalized form (规格 化 形式 ) ”典型 浮 点 数 的 标准 格式 (根据 IEEE 754 标 准 )。 这 种 格式 包 
括 : 一 个 符号 位 、 一 个 8 位 偏 置 指数 、 以 及 一 个 23 位 尾数 〈 隐 含 由 1 打头 )。 

n-type (n 型 ) ”一 种 用 能 提供 电子 的 物质 掺 杂 的 半导体 ， 使 这 些 电 子 能 传导 电流 。 

null (null) 一 个 指定 的 地 址 ， 不 特别 引用 任何 东西 。 

NVRAM (NVRAM) 结合 7 了 RAM 的 现场 可 编程 性 和 ROM 的 持久 性 的 混合 存储 器 。 

nybble ( 半 字 节 ) ”4 个 位 的 一 组 ， 指 的 是 一 个 十 六 进 制 数 字 。 用 作为 表示 存储 器 大 小 的 单位 ， 
或 者 寄存 器 容量 。 很 少 使 用 。 

object-oriented programming (面向 对 象 的 编程 ) 一 种 编程 风格 ， 由 于 Smalltalk、C++ 以 及 
Java 等 语言 而 广为人知 。 在 这 种 编程 风格 中 ， 程 序 由 相互 作用 的 类 和 对 象 组 成 ， 通 信 通 
过 调用 特定 对 象 上 的 方法 来 完成 。 

octal (八进制 ) 基 为 8。 现 在 很 少 使 用 了 。 

OF 溢出 标志 ， 当 最 近 的 带 符 号 数 操作 产生 对 于 寄存 器 而 言 过 大 的 解 时 ， 就 将 其 置 位 。 

offset ( 偏 移 ) ”存储 器 中 两 个 位 置 之 间 的 距离 。 通 常 与 基 寄 存 器 (如 在 8088 存 储 器 段 中 ) 一 
起 使 用 ， 或 者 也 可 作为 转移 指令 改变 PC 的 量 。 

opcode (操作 代码 ) 与 机 器 代码 中 特定 操作 相对 应 的 字 节 。 与 mnemoinc ( 助 记 符 ) 比较 。 
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operands (操作 数 ) ”特定 操作 的 参数 。 例 如 ，ADD 指 令 通常 接受 两 个 参数 。 然 而 ， 在 JVM 
中 ，iadd 不 接受 任何 参数 ， 因 为 两 个 参数 都 已 经 在 堆栈 上 了 。 

operating system (操作 系统 ) ”一 个 控制 程序 ， 用 于 控制 机 器 对 用 户 级 程序 的 可 用 性 ， 并 在 
适当 的 时 间 发 起 和 恢复 。 操 作 系 统 的 常见 例子 是 Windows、Linux、MacOS 及 OS X。 

operator (操作 符 ) ”指明 哪个 数学 或 逻辑 函数 应 该 被 执行 的 符号 或 代码 。 例 如 ， 操 作 符 + 通 
常 是 指 加 法 。 

OR (或 ) ”一 种 布尔 函数 ， 当 且 仅 当 有 一 个 参数 为 真 时 返回 真 ， 否 则 返回 假 。 或 门 是 针对 输 
入 电信 号 实现 了 或 函数 的 硬件 电路 。 

overclocking (超频 ) ”试图 用 比 芯 片 的 额定 速率 快 的 时 钟 运行 计算 机 。 

overflow (溢出 ) ”宽泛 地 说 ， 就 是 当 一 个 算术 操作 产生 一 个 过 大 的 值 而 不 能 存储 到 目标 时 。 
例如 ， 两 个 8 位 数 相 乘 就 可 能 得 出 一 个 16 位 的 结果 ， 存 储 到 8 位 的 目标 寄存 器 就 会 溢出 。 

page (页 ) 存储 管理 系统 中 所 用 的 存储 块 。 

page table (页 表 ) ”存储 管理 器 使 用 的 表 ， 用 来 确定 哪个 逻辑 地 址 对 应 于 哪个 物理 地 址 。 

paging (分 页 ) ”将 存储 器 分 成 “页 ”。 或 者 说 ， 是 计算 机 在 主 存储 器 和 长 期 存储 器 之 间 来 回 
移动 页 的 能 力 ， 用 以 扩展 程序 可 得 到 的 存储 量 并 提高 性 能 。 

parallel (并 联 ) 在 一 个 电路 中 ， 两 个 部 件 如 果 每 个 都 有 一 个 独立 的 路 径 ， 使 得 电流 能 独立 
流 过 ， 则 这 两 个 部 件 就 是 并 联 的 。 参 见 串联 。 

parallelism (并 行 性 ) 计算 机 在 同一 时 间 执行 多 个 操作 的 能 力 。 参 见 MIMD 和 SIMD。 

PC ”一 个 保存 了 当前 正在 被 执行 指令 的 存储 位 置 的 寄存 器 。 改 变 这 个 寄存 器 的 值 将 会 导致 从 
一 个 不 同 的 位 置 装 入 下 一 条 指令 。 这 也 就 是 转移 指令 的 工作 原理 。 

peripheral (外 设 ) “计算 机 的 一 个 部 件 ， 用 于 读 、 写 、 显 示 或 存储 数据 ， 或 者 更 一 般 地 与 外 
部 世界 交互 。 

pipelining (流水 线 操作 ) ” 像 一 个 装配 流水 线 一 样 将 一 个 过 程 (一 般 是 机 器 指令 执行 ) 分 裂 
成 阁 干 个 阶段 。 例 如 ， 计 算 机 可 能 在 执行 一 条 指令 的 同时 取 下 一 条 指令 。 一 个 典型 的 流 
水 线 体系 结构 可 同时 执行 车 干 条 不 同 的 指令 。 

platter ( 盘 片 ) 在 硬 驱 中 的 一 个 独立 的 存储 表面 。 

polling ( 轮 询 ) 进行 测试 以 发 现 某 事件 是 否 已 经 发 生 。 见 busy-waiting (忙碌 -等 待 ) 。 

port-mapped MO (端口 映射 的 MO) ”一 种 执行 1O 的 方法 ， 其 中 与 MO 控 制 器 的 通信 是 通过 配 
属于 主 总 线 的 特定 端口 实现 的 。 

postfix (后 级 ) ”一 种 写 表达 式 的 方法 ， 其 中 的 二 元 操作 符 放 在 其 操作 数 的 后 面 ， 如 34+。 可 
与 infix (中 缀 ) 或 prefix (前 缀 ) 比较 。 

prefetch ( 预 取 ) 在 前 一 条 指令 执行 完毕 前 就 取 指令 。 一 种 粗糙 形式 的 流水 线 操作 。 

prefix (前 缀 ) ”一 种 写 表 达 式 的 方法 ， 共 中 的 二 元 操作 数 放 在 其 操作 符 的 前 面 ， 如 +34。 可 与 
中 组 或 后 缀 比较 。 

primordial class loader (原始 类 加 载 器 ) ”主要 的 类 加 载 器 ， 负 责 加 载 和 链接 JVM 中 所 有 的 
类 。 

program counter (程序 计数 器 )” 见 PC。 

programmable ROM (可 编程 ROM) 现场 可 编程 (但 不 是 可 擦 除 的 ) ROM。 与 传统 ROM 芯 
片 不 同 ， 这 些 芯片 可 进行 少量 的 编程 而 无 需 建立 全 部 的 生产 线 。 

programming models (可 编程 模型 (模式)) ”一 种 对 计算 机 体系 结构 和 能 力 所 定义 的 概观 ， 
由 于 安全 方面 的 原因 故 有 限制 。 
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PROM (PROM) 见 Programmable ROM。 

protected mode (保护 模式 ) 一 种 编程 模式 ,其 中 程序 的 能 力 受 存储 管理 和 安全 问题 所 限制 。 
对 在 多 处 理 系统 上 的 用 户 级 程序 有 用 。 

pseudorandom ( 伪 随 机 ) 一 个 由 算法 生成 的 近似 随机 性 。 

p-type (P 型 ) 一 种 用 能 捕获 电子 〈 即 “提供 空 穴 ”) 的 物质 掺 杂 的 半导体 ， 使 这 些 电 子 不 能 
传导 电流 。 

radix point (基数 小 数 点 ) “十 进 制 小 数 点 ”思想 的 推广 ， 是 针对 不 限于 10 的 基数 。 

RAM ”能 够 在 任意 位 置 读 出 和 写 人 的 存储 器 。RAM 是 易 失 性 的 ， 即 掉 电 后 则 存储 器 中 数据 也 
会 丢失 。 

Random Access Memory (随机 存 取 存储 器 ) 见 RAM。 

Read-Only Memory (只 读 存 储 器 )” 见 ROM。 

real mode ( 实 模式 ) ”一 种 编程 模型 ， 其 中 程序 能 使 用 机 器 的 全 部 能 力 ， 绕 开 了 安全 性 和 存 
储 管理 。 主 要 用 于 操作 系统 和 其 他 的 管理 级 程序 。 

record (记录 ) 一 组 命名 的 域 ， 但 没有 方法 。 

reduced instruction set computing (精简 指令 集 计 算 ) 见 RISC 。 

register (寄存 器 ) ”CPU 内 部 的 一 个 存储 位 置 ， 用 于 存储 目前 正在 操作 的 数据 和 指令 。 

register mode (寄存 器 模式 ) ”一 种 寻 址 模式 ， 其 中 的 一 个 位 模式 被 解释 为 一 个 特定 的 寄存 
器 。 在 寄存 器 模式 中 ， 位 模式 0x0001 就 会 被 解释 成 第 一 个 寄存 器 。 

return (return) 在 子 例 程 结束 时 将 控制 传递 回调 用 环境 的 过 程 (也 常 指 返回 所 用 的 指令 ) 。 

RISC 一 种 计算 机 设计 观点 ， 即 使 用 一 些 短 的 通用 指令 。 与 CISC 相 对 。 

ROM 只 能 读 出 不 能 写 入 的 存储 器 。ROM 是 非 易 失 性 的 ， 即 车 掉 电 则 存储 器 中 的 数据 仍 能 保 
持 。 

roundoff error ( 舍 入 误差 ) ” 当 一 个 浮 点 表示 不 能 表示 精确 的 值 时 所 发 生 的 误差 ,通常 是 因 
为 定义 的 尾数 过 短 。 期 望 的 值 将 被 “ 含 人 ”到 最 接近 的 可 表示 的 量 。 

SAM 不 能 以 任意 顺序 访问 ， 却 必须 以 预先 定义 的 顺序 访问 的 存储 器 ， 如 磁带 记录 。 

seed (种 子 ) 用 于 开始 生成 伪 随 机 数 序列 的 值 。 

segment ( 段 ) ”宽泛 地 说 ， 是 存储 器 中 的 一 个 连续 区 域 。 更 明确 地 说 ， 是 由 80x86 系 列 的 一 
个 段 寄 存 器 所 引用 的 一 个 存储 器 区 域 。 

segment:offset ( 段 : 偏 移 ) ”在 英特尔 8088 (或 以 后 的 模型 ) 的 16 位 寄存 器 上 表示 20 位 逻辑 
地 址 的 一 种 可 选择 的 方式 。 

segment register (〈 段 寄存 器 ) ”80x86 系 列 的 一 个 寄存 器 ， 用 于 为 代码 、 堆 栈 及 数据 定义 存 
储 块 ， 并 扩展 可 得 到 的 地 址 空间 。 

semiconductor (半导体 ) ”一 种 电 材料 ， 处 于 导体 和 绝缘 体 之 间 ， 可 用 于 生成 二 极 管 、 三 极 
管 、 及 集成 电路 。 

Sequential access memory (顺序 访问 存储 器 ) 见 SAM。 

series (串联 ) ”在 一 个 电路 中 ， 两 个 部 件 如 果 只 有 一 条 路 径 使 得 电流 流 过 两 个 部 件 ， 则 这 两 
个 部 件 就 是 串联 的 。 参 见 parallel (并 联 )。 

SF 符号 标志 ， 当 最 近 操 作 产 生 一 个 负 的 结果 时 将 其 置 位 。 

shift ( 移 位 ) 一 种 操作 ， 其 中 寄存 器 中 的 位 被 移动 到 (左边 或 右边 的 ) 相 邻 位 置 。 

sign bit (符号 位 ) ”在 有 符号 数 的 表示 中 ， 用 于 指明 值 是 正 数 还 是 负数 的 位 。 通 常 符号 位 为 1 
用 于 表示 负数 。 对 于 整数 和 浮 点 数 都 是 这 样 。 
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signed (有 符号 的 ) 一 个 可 以 为 正 或 为 负 的 量 ， 与 只 能 为 正 的 无 符号 的 量 相 对 。 

SIMD (SIMD) ”计算 机 在 同一 时 间 在 不 同 的 数据 块 上 执行 同一 条 指令 的 能 力 。 例 如 ， 将 存储 
器 中 若干 个 元 件 同时 清 零 。 

Single Instruction Multiple Data ( 单 指令 多 数据 ) 见 SIMD。 

source ( 源 ) ”数据 的 来 处 。 例 如 ， 在 指令 iload_3 中 ， 源 就 是 局 部 变量 #3。 

source index ( 源 变 址 ) 在 80x86 类 列 中 的 一 个 寄存 器 ， 用 于 控制 串 原 始 操作 的 来 源 。 

source operand ( 源 操作 数 ) ”定义 了 一 条 指令 的 操作 来 源 的 操作 数 。 在 奔腾 指令 集中 ， 源 
操作 数 通常 就 是 在 MOV AX, BX 中 的 源 操作 数 。 

src 源 的 简写 。 

S-R flip-flop (S-R 触 发 器 ) ”用 于 将 单个 位 的 值 作为 一 组 自 增强 晶体 管 的 电压 进行 存储 的 电 
路 。 

stack (堆栈 ) ”一 种 数据 结构 ， 其 中 的 元 素 只 能 在 一 端 插入 〈 压 和 人) 和 删除 (弹出 ) 。 堆 栈 在 - 
机 器 体系 结构 中 的 用 途 是 作为 短期 存储 器 生成 和 销毁 新 位 置 的 方式 。 

stack frame (堆栈 帧 ) ”一 种 基于 堆栈 的 内 部 数据 结构 ， 用 于 存储 当前 正在 执行 程序 或 子 例 
程 的 局 部 环境 。 

stack machine (状态 机 ) ”一 个 计算 机 程序 ， 其 中 计算 机 仅 根 据 接收 到 的 特定 输入 或 事件 从 
一 种 命名 的 “状态 ”变化 到 另 一 个 状态 。 

static (静态 的 )” 见 class method (类 方法 )。 

static RAM (静态 RAM) 见 SRAM。 

string primitive ( 串 基 元 ) “80x86 系 列 上 的 一 种 操作 ， 用 于 对 像 串 这 样 的 字 节 数组 进行 移动 、 
拷贝 或 其 他 处 理 。 

Structure (结构 )” 见 record (记录 )。 

subroutine ( 子 例 程 ) 一 个 被 封装 的 代码 块 ， 在 程序 执行 的 过 程 中 可 从 若干 个 不 同 的 位 置 调 
用 ， 之 后 控制 再 被 传递 回 被 调用 的 地 点 。 

superscalar (超标 量 ) 一 种 通过 复制 流水 线 或 流水 线段 来 增强 性 能 ， 以 达到 MIMD 并 行 性 的 
方法 。 

supervisor (管理 模式 ) ”一 种 特权 编程 模型 ， 在 这 种 模式 下 ， 计 算 机 有 能 力 以 一 种 方式 控制 
系统 ， 而 这 种 控制 方式 通常 是 安全 体系 结构 所 禁止 的 。 管 理 模式 通常 为 操作 系统 所 使 用 。 
参见 real mode ( 实 模式 )。 

this ”在 java 中 ， 就 是 其 实例 方法 正在 被 调用 的 当前 对 象 。 在 jasmin 中 ， 引 用 this 的 对 象 总 是 作 
为 局 部 变量 如 传递 。 

throughput (吞吐 量 ) ”每 个 时 间 单 位 能 完成 的 操作 数量 。 这 与 在 多 处 理 器 上 的 等 待 时 间 
(latency) 或 许 不 同 ， 例如， 多 处 理 器 能 在 相等 的 等 待 时 间 内 同时 完成 若干 个 操作 ， 实 际 
上 达到 了 期 望 吞吐 量 的 若干 倍 。 

Throwable (可 抛 出 ) ”在 JVM 中 ，athrow 指 令 抛 出 的 一 个 对 象 、 一 个 异常 或 者 错误 。 

timer (定时 器 ) 一 种 对 时 钟 脉冲 进行 计数 的 电路 ， 以 确定 流失 的 时 间 量 。 

time-sharing (时 间 共 享 ) ”一 种 形式 的 多 重 处 理 技 术 ， 其 中 CPU 在 一 个 时 刻 为 一 个 程序 运行 
一 小 段 时 间 ， 这 就 给 出 了 多 个 程序 都 在 同时 运行 的 幻觉 。 

two's complement notation (二 进 制 补 码 表 示 ) ”一 种 存储 带 符号 整数 的 技术 ， 使 得 加 法 操作 
对 于 正 数 和 负数 都 一 样 进行 。 在 二 进 制 补 码 表示 中 ， 一 1 的 表示 就 是 所 有 位 都 是 1 的 位 
向 量 。 
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typed 〈 带 类 型 的 ) ”就 是 在 计算 、 表 示 、 或 操作 中 ， 被 处 理 数据 的 类 型 影响 到 结果 的 合法 性 
和 正确 性 。 例 如 ，istore_0 就 是 一 个 带 类 型 的 操作 ， 因 为 它 只 存储 整数 。 相 反 ，dup 操 作 
是 不 带 类 型 的 ， 因 为 它 复制 任何 的 堆栈 元 素 。 

U 在 英特尔 奔腾 处 理 器 上 的 两 个 5 段 流 水 线 之 一 。 

unary (一 元 的 ) 一 种 只 接受 一 个 操作 数 的 数学 操作 ， 如 取 反 或 求 余弦 。 

unconditional (无 条 件 的 ) ”总 是 ， 比 如 在 一 个 无 条 件 转移 中 ， 总 是 转移 。 

Unicode 一 个 字符 表示 的 集合 ， 包 括 了 比 ASCII 更 大 量 的 字母 。 见 UTEF-16。 

unsigned (无 符号 的 ) 一 个 只 能 是 正 数 或 负数 的 量 ， 与 可 正 可 负 的 带 符号 量 相反 。 

update mode (更 新 模式 ) ”一 种 寻 址 模式 ， 其 中 寄存 器 的 值 在 访问 后 被 更 新 ， 如 递增 到 下 一 
个 数组 位 置 。 

user mode (用 户 模式 ) ”一 组 编程 模式 ， 其 中 程序 的 能 力 受到 安全 体系 结构 和 操作 系统 的 限 
制 ， 以 防止 两 个 程序 做 有 害 的 交互 作用 。 | 

UTF-16 ”与 ASCII 不 同 的 字符 编码 方式 ， 其 中 字符 被 作为 16 位 的 量 存储 。 这 就 可 允许 在 字符 
集中 容纳 多 达 65535 种 不 同 的 字符 ， 足 够 将 大 量 的 非 英文 和 非 拉丁 字符 包括 进来 。 

V 在 英特尔 奔腾 上 两 个 5 段 流水 线 之 一 。 

verifier (验证 器 ) ”加 载 类 文件 并 进行 验证 的 阶段 ， 或 者 执行 这 种 验证 的 程序 。 

verify (验证 ) ”在 JVM 上 ， 就 是 确认 一 个 方法 或 类 可 成 功 地 运行 而 不 会 引起 安全 问题 的 过 程 。 
例如 ,试图 将 先前 作为 浮 点 数 装 入 的 值 作为 整数 值 存储 就 会 引起 一 个 错误 ， 但 在 类 文件 
被 验证 时 可 捕获 到 这 个 错误 。 

virtual address (虚拟 地 址 ) ”在 虚拟 存储 系统 中 的 一 个 抽象 地 址 ， 在 实际 存储 器 中 可 存在 或 
不 存在 (并 可 在 长 期 存储 器 中 存在 )。 参 见 logical mode (逻辑 地 址 ) 。 

virtual address space (虚拟 地 址 空间 )” 见 virtual address (虚拟 地 址 )。 

virtual memory (虚拟 存储 器 ) ”计算 机 解释 逻辑 地 址 并 将 其 转换 成 物理 地 址 的 能 力 。 也 就 是 
计算 机 访问 实际 上 不 在 主 存储 器 中 的 逻辑 地 址 的 能 力 ， 这 是 通过 将 逻辑 地 址 空间 的 某 些 
部 分 存储 到 磁盘 并 按 需 要 装 入 到 存储 器 来 实现 的 。 

virtual segment identifier (虚拟 段 标志 码 )” 见 VSID。 

VSID 一 个 位 模式 ， 用 于 将 逻辑 地 址 扩展 成 更 大 的 地 址 空间 ， 为 存储 管理 器 所 使 用 。 

watchdog timer (看 门 狗 定时 器 ) ”一 种 定时 器 ， 当 触发 时 ， 就 会 复位 计算 机 ， 或 者 进行 检验 
以 确认 机 器 没有 进入 一 个 无 限 循 环 ， 或 者 无 反应 的 状态 。 

word ( 字 ) “在 机 器 中 数据 处 理 的 基本 单位 ， 一 般 是 通用 寄存 器 的 大 小 。 在 写 这 本 书 的 时 候 
(2006 年 ) ， 多 数 可 买 到 的 计算 机 的 典型 值 是 32 位 。 

ZF 零 标 志 位 ， 当 最 近 操 作 的 结果 为 0 时 将 其 置 位 。 
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